ÚVOD Vítáme vás v prostředí Recognita Plus 5.0, mnohojazyčném programu pro optické rozpoznávání znaků (OCR - Optical Character Recognition), pracujícím v prostředí Windows 95, Windows 98, Windows NT 4.0 a Windows 2000. Program umožní převádět vytištěné dokumenty nebo obrazové soubory do textu v počítači, který snadno a pohodlně zpracujete pomocí textového editoru. Informace v této příručce vám přiblíží práci s programem Recognita Plus. Tato příručka Tato příručka je určena k tomu, aby vám pomohla získat základní znalosti o programu Recognita Plus. Obsahuje pokyny k provedení instalace a nastavení programu, poskytne Vám základní představu o funkci optického rozpoznávání znaků a přiblíží vám všechny možnosti, které tento software nabízí. Vysvětluje typické postupy při zpracování dokumentů. Příručka se však nezabývá zvláštními možnostmi a nezahrnuje všechny dostupné funkce. Nápověda Online Do větších detailů je propracována elektronická pomoc online - nápověda. Nápověda nabízí přesnou dokumentaci pro všechny možnosti programu, nastavení a postupy a poskytne Vám odpovědi na široký okruh otázek. Tipy dne Při každém spuštění programu se zobrazí okénko s Tipy dne (pokud tuto možnost nevypnete), kde budou uvedeny užitečné rady a pomůcky k jednotlivým funkcím programu Recognita Plus. Tyto informace Vám pomohou využít možnosti programu Recognita Plus ve větším rozsahu. Podporované skenery V kapitole 1 v části "Požadavky na systém" jsou uvedeny bližší informace o používání vhodných skenerů pro program Recognita Plus. Kapitola 1 Instalace a nastavení Kapitola obsahuje informace k následujícím bodům: * Požadavky na systém * Instalace * Nastavení skeneru pro Recognita Plus * Registrace Požadavky na systém K instalaci a spuštění programu Recognita Plus potřebujete vybavení alespoň s následující charakteristikou: * Počítač (PC) IBM kompatibilní s procesorem Intel Pentium nebo jiným, ekvivalentním procesorem. * Operační systém Microsoft Windows 95, Windows 98, Windows NT 4.0, nebo Windows 2000. * 8 MB paměti (RAM) pro Windows 95 a Windows 98 (16 MB je doporučeno), 16 MB paměti (RAM) pro Windows NT 4.0 a Windows 2000 (32 MB je doporučeno). * 35 až 45 MB volného místa na pevném disku, v závislosti na typu instalace, který si vyberete. K uložení výstupů v programu Recognita Plus potřebujete mnohem více volného prostoru na disku, zejména pokud vytváříte vícestránkové dokumenty a jsou-li v dokumentech Recognita vloženy obrázky. * Pro skenování tištěných dokumentů potřebujete podporovaný skener s rozlišením 300 nebo 400 dpi. Bližší informace o přímo podporovaných skenerech jsou obsaženy v souborech SCAN_???.RTF dodávaných s programem (xxx v názvu souboru definuje použitý jazyk , tj. eng pro angličtinu, ger pro němčinu atd.). Přístup do obsahu souboru v jazyce nastavení získáte přes zkratku “Ovladače skenerů Recognita” v skupině programů Recognita. Bližší informace o použití vhodných skenerů jsou uvedeny na našich webových stránkách www.caere.com/ recognita. K získání informací o skenerech s řízeným přístupem přes Caere’s Scan Manager použijte zkratku k vyvolání informací o nastavení ”Scan Manager Setup Notes” v skupině programů Recognita. Ke zpracování obrazových souborů můžete používat program Recognita Plus bez skeneru. * VGA monitor (přednostně typ, který podporuje 256 barevných odstínů při zpracování barevných obrazů). * Myš, nebo jiné zařízení pro ukazatel. * V průběhu instalace čtecí mechaniku CD-ROM. Instalace Při instalaci je každý váš krok veden jasnými pokyny. Nejprve zajistěte ukončení všech aplikací spuštěných uživatelem, případně aplikací spuštěných automaticky při startu systému. Důležité: K instalaci programu v prostředí Windows NT 4.0 a Windows 2000 je nutné přístupové oprávnění správce systému. Instalace programu Recognita Plus: 1. Vložte CD-ROM Recognita Plus 5.0 do vaší CD-ROM mechaniky. Vyčkejte na automatický start setupocr.exe. Nenastartuje-li, vyhledejte jednotku CD-ROM buď v Průzkumníkovi Windows (Windows Explorer), nebo ji identifikujte v dialogovém oknu Procházet (Browse) v menu Start pod příkazem Spustit a otevřete soubor setupocr.exe z hlavního adresáře CD. 2. Nejprve program požádá o vložení vašeho CD klíče. Naleznete jej na zadní straně pouzdra CD-ROMu. 3. Objeví se Pomocník Recognita Setup, tj. pomocník automatického průběhu nastavení Recognita Plus. Zvolte jazyk instalace a postupujte podle pokynů na obrazovce. 4. Na základě dotazu programu specifikujte nastavení a potom po každém kroku instalace klikněte na Další, nebo klikněte na Zpět, budete-li požadovat změnu nastavení zadaného v předchozích krocích. 5. Klikněte na Konec pro dokončení instalace a kopírování všech potřebných souborů do vámi specifikovaného adresáře. 6. Po těchto krocích ovládáte řízení následujících nastavení uvedených v přehledovém dialogovém boxu: * Jazyk pro program (tj. jazyk používaný v menu, ve zprávách a pod.) * Jazyky pro nápovědu * Konvertory textových výstupů * Slovníky určené pro pravopisnou a jazykovou analýzu * Přímé propojení do aplikací a propojení s elektronickou poštou. Poznámka: V průběhu instalace Recognita Plus Maintenance Setup (Podpora nastavení pro Recognitu) bude tento program zařazen do skupiny programů Recognita Plus 5.0. Později jej můžete využívat pro změny v nastavení programu Recognita Plus, např. přidat nový ovladač skeneru, nebo nový textový konvertor, povolit přímé propojení atd. Do skupiny programů bude rovněž zařazena možnost odinstalování programu. Nastavení skeneru pro Recognita Plus Recognita Plus může mít různé způsoby připojení ke skenerům. Preferovanou metodou je řídící program Caere’s Scan Manager a tento způsob řízeného přístupu ke skeneru je standardně nastaven při instalaci programu. Scan Manager je pravidelně aktualizovaná sada programů dodávaná firmou Caere Corporation. Program zajišťuje plnohodnotný přístup k velkému a stále rostoucímu množství skenerů. Instalace Scan Manager probíhá automaticky a tvoří poslední fázi nastavení programu Recognita Plus ve vašem počítači. Při instalaci se vyvolá dialogové okno s nabídkou různých typů skenerů. Z této nabídky vyberte skener pouze v případě, kdy budete skenovat pomocí Scan Manager, nebo v případě, kdy potřebujete nastavit “žádný skener”. První položka seznamu je (Generický). Vyberte tuto možnost pro nastavení “žádného skeneru” nebo standardního rozhraní pro ovladač TWAIN nebo ISIS. V obou posledních případech musíte zkontrolovat, jestli vyhovují standardní hodnoty nastavení. Pro výběr specifického skeneru (s názvem) klikněte na název skeneru, tím vyvoláte seznam jednotlivých modelů. Vyberte vyhovující model(y). Scan Manager obvykle zajišťuje přístup do skeneru přes ovladač TWAIN, ale provádí všechna potřebná nastavení automaticky. Ve fázi nastavení programu Scan Manager pro řízení přístupu ke skeneru se do ovládacího panelu Windows zařadí nová ikona. Kliknutím na tuto ikonu vyvoláte možnosti pro změnu instalovaného skeneru nebo příslušných zadaných parametrů. I v případě, kdy nemáte skener, můžete používat program Recognita Plus ke zpracování obrazových souborů vytvořených pomocí jiného skenovacího softwaru, nebo obrazových souborů zaslaných elektronickou poštou, nebo faxem. V takovém případě musíte odstranit Scan Manager ze standardní pozice, nebo vybrat (Generický)/žádný skener. Setkáte-li se s problémy při instalaci programu pro připojení skeneru, podívejte se na další popis “Změna nastavení skeneru”. Změna nastavení skeneru Dříve než začnete zadávat jakékoliv změny v nastavení připojeného skeneru, nejprve ověřte, jestli skener funguje s nainstalovaným softwarem od dodavatele skeneru. V průběhu nastavení musí být skener aktivní. Parametry připojení skeneru můžete měnit pomocí programu Uživatelské nastavení Recognita. Přístup ke skeneru je zajištěn několika způsoby, dle potřeby použijte vhodný způsob: * Specifický typ skeneru nabídnutý řídícím programem Caere’s Scan Manager. * Univerzální typ skeneru nabídnutý řídícím programem Caere’s Scan Manager. * Ovladač skeneru dodaný s programem Recognita Plus. * Jeden z ovladačů TWAIN dodaných s programem Recognita Plus. Při spuštění Uživatelského nastavení Recognita se na obrazovku vyvolá dialogové okno: * Scan Manager je uveden na prvním místě v seznamu Instalovaných ovladačů skenerů. Je automaticky umístěn v panelu Instalovaných skenerů a nastaven jako standard. Budete-li s ovladačem Scan Manager pracovat, ponechte jej v uvedeném nastavení a zadejte skener v příslušném dialogovém oknu. Nebudete- li používat Scan Manager, odstraňte jej z aktivního nastavení, nebo přidejte ovladač nebo více ovladačů přímo dodaných s programem Recognita a jeden z nich nastavte jako standardní ovladač. Následující témata se zbývají nastavením ovladačů Recognita pro připojené skenery v případě, kdy nastanou problémy s řídícím programem Scan Manager. K nastavení vašeho skeneru: 1. Zapněte skener. 2. Z instalovaných ovladačů (driverů) vyberte ten, který odpovídá Vašemu modelu skeneru. 3. Klikněte na Instalace. Jméno ovladače se objeví v seznamu instalovaných skenerů. Pokud máte k vašemu počítači připojeno několik skenerů, ovladače pro všechny skenery můžete instalovat stejným způsobem. 4. Zobrazí se dialogové okénko se standardním nastavením od výrobce: * * Zobrazí se nastavení, jako např. Adresa portu, hodnoty přerušení, karty rozhraní atd. Položky vyznačené šedou barvou nejsou pro zadaný skener potřebné. Zkontrolujte správnost položek. Specifikujte, zda je váš skener vybaven automatickým podavačem dokumentů (ADF) nebo adaptérem na průsvitky. 5. Klikněte na Zkontrolujte rozhraní skeneru k přezkoušení konfigurace a k ověření správnosti všech zadaných informací. Zjistí-li program nesprávnou informaci, zobrazí upozornění o chybné položce. Může to být v případě, kdy program nemůže identifikovat rozšiřující kartu rozhraní, nebo je chybně zadaná adresa portu a podobně. Pokud nemůžete označený problém vyřešit hned, pokračujte v nastavení a později otevřete soubor SCAN_???.RTF, kde získáte seznam všech standardních nastavení výrobce, potom spusťte funkci Podpora nastavení k zadání změn v nastavení skeneru dle vašich požadavků. 6. Klikněte na OK pro návrat do hlavního panelu skeneru. 7. Pokud jste instalovali několik skenerů, vyberte jeden pro běžné použití a klikněte na Nastavit jako základní skener. Základní skener můžete kdykoli později změnit pomocí funkce Podpora nastavení pro Recognitu. 8. Potřebujete-li odstranit instalovaný skener, vyberte příslušný název v seznamu instalovaných skenerů a klikněte na Odstranit. Nastavení skenerů vyhovujících TWAIN TWAIN je standardní rozhraní pro zařízení pracující s obrazy. Většina výrobců skenerů dodává ke svým skenerům ovladače vyhovující prostředí TWAIN. Recognita Plus má své vlastní ovladače specifické pro mnohé modely skenerů a podporuje TWAIN. Máte-li v počítačí instalován skener vyhovující požadavkům TWAIN, můžete v průběhu instalace a při aktivaci funkce Podpora nastavení pro Recognitu vybrat jeden ze vstupů specifických pro TWAIN. Seznam ovladačů obsahuje standardní typ zadání pro TWAIN: - TWAIN: Basic Driver - a jednu nebo dvě položky ke každému instalovanému skeneru vyhovujícímu požadavkům TWAIN ve tvaru: - TWAIN: Tyto dvě položky se zobrazí, jestliže v prostředí Windows 95 nebo Windows 98 jsou instalovány oba zdroje dat v rozsahu 16 a 32 bitů. Vždy zvolte ovladač 32 bitů, pokud je k dispozici. Poznámka: Jestliže se název vašeho skeneru vyhovujícího požadavkům TWAIN zobrazí v seznamu ovladačů jako samostatná položka (bez předpony "TWAIN"), můžete tento skener vybrat a Recognita Plus s ním bude pracovat přes vlastní ovladač skeneru (tuto možnost doporučujeme). Výběr vstupu “TWAIN:“: Název datového zdroje obsahuje jméno produktu pro daný zdroj dat (velmi často se může lišit od aktuálního jména modelu skeneru). Doporučujeme, abyste jej vybrali přednostně před základním ovladačem TWAIN. Zvolíte-li tento ovladač, nastavení skeneru můžete provést v uživatelském rozhraní Recognity Plus. Výběr vstupu “TWAIN: Basic Driver“: TWAIN: Basic Driver -základní ovladač TWAIN použijte pouze v případě, kdy máte problémy se skenováním při použití ovladače typu TWAIN: . Zvolíte-li TWAIN: Basic Driver, můžete změnit nastavení skeneru ve vlastním uživatelském rozhraní zdrojových dat, které se vyvolá při každém spuštění funkce snímání z Recognity Plus. Po dokončení kroku 5 nebo kroku 6 v nastavení vašeho skeneru (viz str. 12) se objeví dialogové okénko Vybrat zdroj se seznamem jmen instalovaných datových zdrojů. Tato jména jsou identická se jmény položek v ”TWAIN:”. Ale tentokrát bez označení ”TWAIN”. Zde je nutné specifikovat, který typ zadání chcete použít pomocí základního ovladače Twain v programu Recognita Plus. Ostatní problémy TWAIN: Uživatelské rozhraní datového zdroje TWAIN může nabízet nastavení nevhodná pro potřeby OCR. Může to být např. extrémní hodnota rozlišení, polotónový (vytečkovaný) výstup obrazu, barevné skenování atd. Požadovaných výsledků snímání dosáhnete, nebudete-li tato nastavení používat. V některých případech se Recognita Plus vrátí zpět k použití základního ovladače TWAIN bez ohledu na vybraný ovladač TWAIN: . To není chyba, ale stává se to, pokud Recognita zjistí, že nemůže řídit všechna vybraná nastavení skeneru. Připomínáme, že v tomto případě parametry skeneru mohou být nastaveny na hodnoty zadané ve vlastním uživatelském rozhraní. Používáte-li TWAIN základní ovladač, můžete aktivovat automatický podavač dokumentů zdrojových dat. Pro tuto možnost zadejte řádek: AdfHandling=1 do inicializačního souboru ve složce SCANNER.INI Recognita Plus. Bude-li podavač fungovat správně, uživatelské rozhraní bude zobrazeno pouze před první stránkou dávky. V opačném případě se zobrazí před každou jednotlivou stránkou. Speciální nastavení skeneru pod Windows 95 a Windows 98 Obdržíte-li chybové hlášení v průběhu skenování pod Windows 95 nebo 98 a nejedná se o reálnou chybu skeneru, zadejte následující řádek do vašeho souboru CONFIG.SYS hned po záznamech HIMEM.SYS a EMM386.EXE: DEVICE=\RSDBUF.EXE [/8] kde je plná cesta nastavená pro Recognita Plus. V tomto řádku nesmíte použít instrukci DEVICEHIGH. Tento ovladač přiřazuje vyrovnávací paměť v oblasti konvenční paměti pro ovladače skeneru Recognita. Je-li nastaven přepínač /8, je přiřazeno méně paměti (8k). Nepoužívejte přepínače /8 u následujících typů skenerů: * Ricoh RS632 s ISI-8 rozšiřující kartou rozhraní * Siemens skenery * Lightscan 400P * Pentax DS6, DS10 * Mitsubishi MH216CG * AVision skenery * Dextra Reader * Genius FastReader * Mouse Systems PB/Reader * Targa TS 30n, TS 600C, TS 800C Registrace Registrovaní zákazníci Recognity Plus 5.0: * mají přístup k službám naší technické podpory * průběžně obdrží nejnovější informace o nových a zlepšených produktech Recognita * průběžně obdrží nabídky na vyšší verzi za speciální ceny. Neregistrovaní uživatelé jsou pravidelně vyzýváni k registraci při spuštění programu Recognita Plus. Pokud se zaregistrujete, program vás nebude dále vyzývat k registraci. Při registraci obdržíte své registrační číslo, které musíte zadat do příslušného textového okénka Pomocníka registrace Recognita. K obdržení registračního čísla: 1. Z menu Nápověda vyberte Registrace… pro spuštění Pomocníka registrace Recognita. Tento program automatické podpory se rovněž aktivuje při prvním spuštění programu Recognita Plus. 2. Klikněte na Další pro úvodní okno. Objeví se následující okno: * 3. Nejprve vyberte jeden ze tří nabídnutých způsobů registrace. Kliknutím na každou položku zjistíte, jak daný způsob registrace probíhá. * Online Zvolíte-li registraci Online a potom kliknete na Další, program vás navede na webovou stránku registrace, kde můžete vyplnit elektronický registrační formulář a obratem získat své registrační číslo. Potom se vraťte na obrazovku Pomocníka registrace, zadejte přidělené registrační číslo a klikněte na Další pro jeho potvrzení. * Offline Zvolíte-li metodu registrace Offline a kliknete na Další, Pomocník registrace vyvolá formulář v elektronické podobě. Vyplňte formulář a k zobrazení každé následující stránky klikněte na Další. Nakonec klikněte na Registrace, program začne vyhledávat spojení pro e-mail a potom na fax- modem. Na obrazovku se vyvolá informace o zvoleném způsobu odeslání. Jestliže vyhledávání komunikačního spojení nebylo úspěšné, program tento formulář vytiskne. Není-li připojena nebo nastavena tiskárna, program nabídne možnost uložit formulář na disk. Prosíme, abyste vyplněný formulář odeslali faxem nebo poštou, případně můžete použít přiloženou registrační kartu. Registrační číslo obdržíte přes e-mail, faxem, nebo poštou. Kliknutím na tlačítko OK ukončíte program Pomocníka registrace Recognita. Telefonicky V některých zemích si můžete zakoupený program zaregistrovat telefonicky (v současné době je to možné v České republice, v Maďarsku, v Německu, v Polsku a ve Švédsku). Klikněte na volbu Telefon a v rolovací nabídce telefonních čísel vyberte potřebné číslo nejbližšího zastoupení produktu. Při registraci musíte nadiktovat výrobní číslo svého produktu. Při telefonické registraci je vhodné mít otevřenou obrazovku Pomocníka registrace Recognita, abyste mohli své registrační číslo zadat do programu a kliknutím na Další ihned vyzkoušet. Zavedení registrace: 1. V menu Nápověda zvolte Registrace… ke spuštění Pomocníka registrace Recognita, pokud již neběží. 2. V panelu s nabídkou registračních metod zadejte přidělené registrační číslo do zobrazeného textového pole. 3. Klikněte na Další pro potvrzení registračního čísla a ukončení procesu registrace. 4. Své registrační číslo si poznamenejte na bezpečné místo, doporučujeme k tomu vyhrazené místo na konci této Příručky uživatele. Kapitola 2 Úvodní informace Recognita Plus Pracovali jste někdy na přepisování textů klávesnicí do počítače? Pokud odpovíte ne, potom patříte mezi ty šťastnější uživatele a není jisté, že to bude navždy. Pokud jste odpověděli ano, potom asi víte, jak únavné může být přepisování tištěných dokumentů. Ale proč ztrácet čas, když se vám nabízí řešení tohoto problému. Program Recognita Plus – jak asi tušíte – je tím řešením. Tento software, který obsahuje velkou nabídku typů písma a jazyků, velmi snadno převede vaše tištěné dokumenty (na papíře) s vysokou přesností do počítačem editovatelné formy. Jakmile začnete s tímto programem pracovat, bude vám zřejmé, že tento produkt znamená konec jedné éry - manuálního přepisování. V této kapitole naleznete informace o následujících skutečnostech: * Co je vlastně OCR? * Stupně zpracování v programu Recognita Plus * Dokument Recognita * Obrazovka aplikace a dokumentu * Elektronická Online nápověda * Co je nového v porovnání s verzí 4.0 * Podpora produktu Co je vlastně OCR? OCR-Optical Character Recognition (optické rozpoznávání znaků) je specializovaný obor zabývající se snímáním tištěných dokumentů pomocí skeneru a převodem textového obsahu do tvaru, který je editovatelný počítačem. Program prozkoumává křivky znaků v textu a určuje, který znak tuto křivku reprezentuje. Technika Recognita Plus je založena na analýze kontur, kde každý znak je definován určitými typickými rozměry nebo poměry jednotlivých elementů v kontuře. Předností analýzy je širší možnost rozpoznávání fontů (omnifont) nezávisle na velikosti znaků a druzích fontu. Jako doplněk k základnímu algoritmu programu slouží Self Assertion Technology (SAT), která vylepšuje práci se znakovou interpretací. Navíc nástroj OCR používá modul jazykového analyzátoru v rozpoznávacím jazyce pro slova, která jsou tvořena z rozpoznávaných znaků. Společné využití těchto technik zajistí optimální rozpoznávání. Recognita Plus 5.0 nabízí novou úroveň přesnosti rozpoznávání, kterou můžete nastavit pro jedenáct hlavních jazyků používaných v Evropě a Americe. Program je vybaven dvěma nástroji rozpoznávání s podporou vlastních jazykových analyzátorů. Oba nástroje načítají text paralelně a výsledek porovnávají. Pokud nastanou rozdíly v nasnímaném textu, oba nástroje provedou ověření jistých znaků k dosažení optimálního řešení. Při testování poškozených dokumentů bylo prokázáno, že používání dvou nástrojů rozpoznávání snižuje výskyt chyb až o 30%. Stupně zpracování v programu Recognita Plus Uživatelé mají různé požadavky a denně musí řešit různé úlohy. To, co všichni potřebují k snadnějšímu řešení svých úkolů, je flexibilní nástroj, který může být přizpůsoben individuálním potřebám každého uživatele. Recognita Plus je užitečný produkt, který má mnohostranné využití při zpracování jednostránkových nebo vícestránkových dokumentů. Nabízí se řada možností od manuálního zadání jednotlivých kroků v dialogu s programem až po plně automatizované zpracování dokumentů. Tato příručka nezahrnuje všechny možnosti, ale popisuje typické pracovní kroky. Kromě toho vás upozorní na účelná nastavení pro průchod dokumentu Recognitou Plus. Pro zadání požadovaných nastavení si přečtěte odpovídající položky v Online nápovědě Recognita Plus. Postup zpracování v Recognitě Plus 1. Získání zdroje vstupu Znamená to získání určitého vstupu. Skenováním vytvoříte digitalizovaný obraz dokumentu. Nebo otevřete existující obrazový soubor získaný z Recognity Plus, Desktopu, nebo ze seznamu Prohlížeče, nebo použitím obrazové přílohy z elektronické pošty. Nasnímaný nebo načtený obraz může být černobílý, v šedých odstínech, nebo barevný a bude zobrazen ve stejné podobě, v jaké byl načten. 2. Předzpracování obrazu Program automaticky připraví nasnímané obrazy pro optimální rozpoznávání tím, že detekuje a odstraní úhlové natočení (skew) a ověří správnou orientaci obrazu. (Orientaci můžete předdefinovat, nebo nechat program, aby ji identifikoval automaticky). 3. Rozklad, zónování V této fázi program identifikuje rozložení informací na stránce a rozdělí je do zón. Program automaticky rozliší grafiku od textu a identifikuje plynulý text nebo text ve formátu tabulky. Program rovněž určí pořadí čtení pro zóny. Zóny můžete vytvořit také manuálním zadáním. Můžete kreslit oblasti zón, modifikovat jejich velikost, polohu, pořadí a přiřadit rozpoznávací nástroj. Máte možnost použít šablony pro zóny. 4. Rozpoznávání Je srdcem celé operace. Zde pracuje jeden až 6 nástrojů rozpoznávání, v závislosti na vlastnostech zóny. Dostupné nástroje jsou: Omnifont (nejčastěji používaný), Bodová matice, Zaškrtávací pole, Čárový kód a Ručně psaná čísla. Výsledkem operace rozpoznávání je dokument Recognita s formátovaným editovatelným textem. Zpracování se po tomto kroku obvykle zastaví. Po zastavení operace můžete změnit nastavení a znovu zadat rozpoznávání stránky. 5. Přezkoušení, učení, editace Tyto funkce tvoří korekčnou fázi a jsou plně řízeny uživatelem. Přezkoušení vám pomůže nalézt problémové oblasti, jako jsou neslovníková slova nebo neznámé znaky. Pomocí funkce Učení můžete program naučit rozpoznat znaky, které byly opakovaně špatně přečteny. Zabudovaný editor nabízí většinu funkcí běžného textového procesoru pro opravy a formátování textu. 6. Uložení a export Pro uložení textu máte k dispozici širokou nabídku textových formátů se stupněm formátování podle vašeho výběru. Také obrazy můžete ukládat v řadě běžně užívaných formátů obrazových souborů. Navíc můžete svoji práci uložit jako Dokument Recognita, obsahující jak text, tak obrazy připravené k dalšímu zpracování. Rovněž je možné kopírování do schránky (Clipboard) a odeslání v příloze elektronické pošty. Tento krok může být manuální nebo automatický. Dokument Recognita Dokument Recognita (souborová přípona RCD) obsahuje stránky, které přímo obsahují obrazy, nebo mají vazby na snímané obrazy vašeho dokumentu a pokud je dokončeno rozpoznání, obsahují také editovatelný text. Data podle obrazů a textu na stránce, které jsou také uloženy v souboru. Tento formát souboru je unikátní pro Recognitu Plus. Každý znak nebo rozpoznávaný element má vazbu na odpovídající část originálního obrazu a tím jsou zajištěny funkce přezkoušení, ověřování a učení. Soubory dokumentů Recognita můžete uložit a později znovu otevřít v tomto programu, vytvářejí základ pro odložené (rozfázované) zpracování, například dávkové skenování provedete jeden den, rozpoznávání další den a plné přezkoušení a uložení textů v dalších dnech. Soubory dokumentů Recognita uložte na libovolně dlouhou dobu, podle toho jak budete potřebovat některé části nebo celý obsah souborů (textů nebo obrazů) v některém z výstupních formátů podporovaných Recognitou Plus. Obrazovka aplikace a dokumentu Recognita Plus může pracovat současně s několika dokumenty. Dokumenty Recognita jsou zobrazeny v oknu dokumentu v pracovní ploše obrazovky aplikace. Typické okno dokumentu je zde zobrazeno ve zvětšeném formátu. * * * Bližší informace o jednotlivých částech obrazu, jejich účelu a využití získáte z kontextové nápovědy. Online Nápověda Recognita Plus má úplný systém nápovědy: Kontextovou a Hlavní. Nápověda poskytuje detailní informace o možnostech, nastavení a pracovních postupech. Menu Nápovědy * Vyberte Použití nápovědy pro přehled jak používat nápovědu. * Vyberte Obsah pro zobrazení informací tříděných podle kategorií a k výběru tématu ze soupisu nápovědy, nebo k vyhledání specifického slova anebo věty podle témat nápovědy, pokud nechcete vyhledávat podle kategorií. * Vyberte jakoukoliv položku v submenu Recognita na Webu k vyvolání webové stránky Recognita, kde získáte nejnovější informace o produktech, řešení problémů, podporovaných skenerech atd. * Volba Tipy dne poskytuje užitečné nápady a rady pro práci s programem Recognita Plus. Okno s Tipy dne se zobrazí. při každém spuštění Recognity Plus, pokud tuto možnost nezrušíte. Systém kontextově orientované nápovědy: * Popisky nástrojů dávají krátké vysvětlení prvků na obrazovce, typické pro tlačítka nástrojové lišty. Objeví se, pokud setrváme s kurzorem na určité položce asi jednu vteřinu. * Zprávy stavové lišty vysvětlují položku menu nebo tlačítka nástrojové lišty. Popis se zobrazí, zvýrazníte-li položku menu nebo stisknete-li tlačítko. * Umístěte kurzor na položku menu a stiskněte F1. Tato funkce je společná pro všechna menu, ale je to také jediná možnost, jak získat nápovědu o položce v kontextovém menu, tj. o položce v menu, která se objeví, když stisknete pravé tlačítko myši. * Kliknutí na tlačítko nápovědy a potom na libovolnou položku menu, nástroj, nebo oblast k získání nápovědy o účelu označené položky. * Dialogová okna mají vlastní nástroj nápovědy vpravo nahoře. Klikněte na něj, potom na libovolnou část dialogového okénka k získání nápovědy o jeho účelu. * Některá dialogová okna mají tlačítko nápovědy vedle nástroje s otazníkem. Kliknutím na něj vyvoláte přehled o účelu dialogového okna. * Symboly pro funkční klíče nebo kombinace klíčů vyznačené při levém okraji této příručky označují instrukce, které spustíte v programu pomocí těchto klíčů. * V části popisující Online nápovědu najdete informace o využití klávesnice, přehled tvarů kurzoru, seznam nastavení a jazyků a rovněž slovník. Co je nového v porovnání s verzí 4.0 Rozpoznávání * Maximální přesnost je dosažena použitím dvou nástrojů rozpoznávání podporujících 11 jazyků. Oba nástroje OCR načítají text paralelně a oba používají zabudovaný slovník. Výsledky načtení se porovnávají a program vyhodnotí stupeň jistoty rozpoznaných znaků, tento proces je důležitý zejména při načtení nekvalitních nebo poškozených dokumentů. * Můžete si vybrat ze 6 stupňů rozpoznávání, od nejrychlejšího k nejpřesnějšímu: s jedním průchodem čtení, s dvěma nebo třemi průchody čtení, navíc s podporou nebo bez podpory jazykového analyzátoru a s použitím jednoduchého nástroje rozpoznávání, nebo dvou nástrojů rozpoznávání. * Nový algoritmus pro řešení úhlového natočení při OCR zajišťuje vyšší přesnost. * Zpracování obrazu * Barevné a šedé obrazy můžete skenovat, vyvolat ze souboru, vytisknout, nebo exportovat. Kombinované typy obrazů (černobílé, šedé a barevné) můžete uložit do jediného, vícestránkového souboru. * Funkce předběžného náhledu usnadňuje orientaci v souborech a vyhledávání požadovaných obrazových souborů. * Program obsahuje nástroj Scan Manager 5.0 firmy Caere, který zajišťuje širší podporu skenerů. Jazyky * Program podporuje jazyky psané azbukou a ve standardní nabídce je deset jazyků: bulharský, běloruský, čečenský, kabardský, makedonský, moldavský, osetský, ruský (se zabudovaným slovníkem), srbský a ukrajinský. * Seznam jazyků můžete upravit dle svých požadavků. Při dodání jsou ve standardní nabídce uvedeny jazyky s podporou slovníků. Můžete vyvolat podrobný seznam všech 114 podporovaných jazyků. Jednotlivé jazyky můžete vyloučit z nabídky, zařadit do nabídky anebo změnit jejich pořadí. Přezkoušení a editace * Statický překryvný přezkoušeč může být nahrazen dynamickým přezkoušečem, který zůstává otevřený a sleduje aktuální pozici editace. Zaměřený znak je zobrazen uprostřed okna přezkoušeče. * Postranní přezkoušeč je v této verzi programu uváděn jako přezkoušeč obrazového okna. * Funkci vyhledávání můžete nastavit na hledání výskytu celého slova. * Desetinný oddělovač v tabulkách je nyní definovaný uživatelem. Zpracování * Funkci zastavení pro zónování můžete vypnout v průběhu zpracování a změnit metodu zónování uprostřed otevřeného dokumentu. * Možnost zavedení dvoustránkové šablony usnadňuje zpracování dvoustránkových formulářů nebo knih. * Funkce zpětného vyvolání uloženého textu je dostupná v kontextovém menu Prohlížeče a je aktivní pro vybrané stránky. Tato funkce je také obsažena v hlavním menu, kde je aktivní pro celý dokument. * Program nabízí vylepšenou podporu ukládání rozpoznaného textu do MS Word 97. Vylepšená podpora pro zrakově znevýhodněné uživatele Rozpoznávání Brailleových znaků Zónu typu Braille můžete zadat jako standardní zónu pro celý dokument. Zónu je možné zadat manuálně, ale všechny zóny v dokumentu musí být typu Braille, jsou povoleny také zóny obsahující pouze čísla. Výstupem bude text s možností další editace, který odpovídá původnímu textu psanému Brailleovými znaky. Obecné úpravy zavedené v programu Textová, obrazová a prohlížecí okna můžete maximalizovat pomocí Ctrl+1, Ctrl+2, Ctrl+3. Příkazem Ctrl+4 se obnoví aktuální okno. Pomocí klávesy F6 můžete aktivovat jednotlivá zobrazená okna. Pomocí klávesy Tab můžete přepínat mezi seznamem Prohlížeče a obrazy stránek v oknu Prohlížeče. Vyberete-li určitou stránku v seznamu Prohlížeče, po stisknutí klávesy F2 můžete zadat text v poli Poznámka. Lze aktivovat návrh učení (neznámého znaku) a vyvolat jej na obrazovku v běžném čtecím programu. Přímá propojení zajišťují Rychlé klávesy. Specifické úpravy Následující úpravy lze vyvolat spuštěním programu Recognita Plus z příkazového řádku aktivací volby /blind: v dialogovém oknu Zobrazení/Sloupce jsou zaškrtávací pole nahrazena popisy ANO/NE. Okno editace zobrazuje znaky podle zadané kódové stránky, nikoli pevně zadaný typ písma Recognita. V panelu Možnosti/Přesnost je posuvná lišta Rychlost/Přesnost s šesti nastavitelnými pozicemi nahrazena roletovým seznamem. To znamená, že všechny zmíněné ovladače lze nastavit pomocí programu pro čtení z obrazovky. Podpora produktu K vašemu zakoupenému programu Recognita Plus si vyplňte registraci, abyste měli oprávnění k využívání podpory produktu. Máte-li nějaké dotazy k programu Recognita Plus a tato příručka ani Online nápověda vám neposkytne uspokojivou odpověď, můžete využít následující služby: WWW domovská stránka Navštívíte-li naší domovskou stránku, získáte informace o ostatních produktech Recognita, odstraňování chyb, o nových verzích programů a obdržíte odpovědi na nejčastěji kladené dotazy (FAQ). Přístup ke stránkám je: * Z menu Nápovědy * Na www.caere.com/recognita Telefonická podpora Můžete zaslat fax, nebo zatelefonovat konzultantům do oddělení naší technické podpory na následující čísla: * Fax: (36 1) 452-3710 * Tel.: (36 1) 452-3706 Pracovníci naší technické podpory jsou připraveni poskytnout požadovanou podporu při práci s programem Recognita Plus. Při telefonování prosíme, abyste uváděli: * Verzi programu Recognita Plus a registrační číslo * Výrobce a model vašeho skeneru * Názvy a čísla verzí ostatního skenovacího softwaru, který používáte se skenerem * Velikost operační paměti (RAM) v počítači * Velikost volného místa na disku, kde máte instalované prostředí Windows * Velikost volného místa na pevném disku, kam ukládáte dočasné soubory (temporary files). Pro výpis nastavení systému včetně cesty do adresáře, kde jsou uloženy dočasné soubory, a na dotaz programu zadejte SET a stiskněte Enter. Klíčové slovo TEMP ukáže dotazovanou cestu. Volné místo na disku je uvedeno na stavové liště v průzkumníku Windows. Vyberte písmeno označující požadovaný pevný disk. * Pokud jste shledali chybu při práci s Recognita Plus, prosíme o: - Přesné zaznamenání všech chybových zpráv. - Zaznamenání všech kroků pro opakované vyvolání chyby. - Pokud možno uložte zónovou šablonu do souboru šablon, který můžete poslat spolu s problémovým obrazem (obrazy). * Při telefonickém volání mějte na počítači spuštěný program Recognita Plus. Kapitola 3 Zpracování dokumentů Tato kapitola poskytuje informace o zpracování dokumentů pomocí programu Recognita Plus. Existují různé způsoby skenování, rozpoznávání, zadání oprav a ukládání dokumentů. V závislosti na kvalitě a počtu stránek zadaných ke zpracování, času potřebného k zpracování, požadované přesnosti a metodách přezkoušení si můžete vybrat z mnoha různých možností zpracování. Můžete kontrolovat stupně zpracování po jednotlivých krocích, nebo zvolit plně automatizované zpracování. Kapitola obsahuje informace k následujícím bodům: * Přehled zpracování * Tvorba dokumentů * Přerušení a pokračování ve zpracování * Rozpoznání obrazů v dokumentu * Práce s dokumenty * Uložení dokumentů, textů a obrazů * Spuštění funkce rozpoznávání z jiné aplikace * Zpracování a uložení bez náhledu Přehled zpracování Následující nákres vám přiblíží hlavní stupně zpracování využitelné v programu Recognita Plus. Průběh zpracování se zastaví (nebo může být zastaven) v označených místech a program umožní různé uživatelské zásahy. Je možné opakovat rozpoznání obrazů s modifikovaným nastavením. Rovněž můžete kdykoliv uložit okamžitý stav dokumentu do souboru dokumentu Recognita. Při pozdějším otevření dokumentu můžete pokračovat v odloženém zpracování. Kromě výše uvedených možností nabízí Recognita Plus unikátní možnost Uložení bez náhledu. Při aktivaci této funkce program zpracovává nasnímané stránky nebo obrazové soubory a ukládá výsledky (obrazy, text nebo dokumenty Recognita) plně automatizovaně do řady výstupních souborů bez zásahu uživatele. Tvorba dokumentů Pro základní zpracování použijte zpracování z obrazového souboru označené ”sample” (vzor). Při skenování dokumentů si vyberte některé vzorové soubory a mějte je při ruce poblíž skeneru. Není možné zadat prázdný dokument Recognita. Nový dokument je vždy tvořen skenováním tištěných materiálů, nebo vložením obrazových souborů a pokud se to vyžaduje, rozpoznáním jejich obsahu. Všeobecně platí, že obrázky mohou být vloženy do textového souboru dokumentu Recognita, nebo lze samostatné obrazové soubory připojit zadáním cesty a názvu. Existují dvě základní metody skenování/vkládání obrazů: * Skenování/vkládání a rozpoznávání. Při použití této metody je výsledkem dokument s obrázky a texty. * Pouze skenování/vkládání. Výsledkem při použití této metody je pouze obrazový dokument. Rozpoznávání může být provedeno později. Je-li spuštěna funkce zpracování a je otevřen alespoň jeden dokument, objeví se dialogové okénko Další dokument: * - Vyberte jednu ze dvou prvních možností, pokud si přejete připojit nové stránky k aktivnímu dokumentu. - Vyberte jednu z dalších dvou možností, potřebujete-li vytvořit nový dokument. Vyberete-li poslední, dialogové okénko Možnosti Vám umožní specifikovat nové nastavení. Vložení (a volitelné rozpoznání) obrazových souborů: 1. Chcete-li použít nástrojovou lištu ke spuštění funkce zpracování, zkontrolujte vybraný zdroj obrazu, musí to být soubor, nikoli skener. Mezi oběma možnostmi můžete přepínat kliknutím na první tlačítko vlevo na nástrojové liště. 2. Spusťte vložení souborů s rozpoznáváním nebo bez rozpoznávání. * S rozpoznáváním: - Ujistěte se, že hlavní tlačítko pro zpracování znázorňuje obraz vlevo a klikněte na něj, nebo * Vyberte Čtení>ze souboru v menu zpracování. * Bez rozpoznávání: - Ujistěte se, že hlavní zpracovatelské tlačítko vlevo ukazuje obrazový soubor a klikněte na ně nebo - Vyberte Skenování>ze souboru v menu zpracování. * Objeví se dialogové okénko pro otevírání souborů: * * Zobrazí poslední použitý soubor v adresáři. Vyberte soubory, které chcete rozpoznávat. Budou zpracovány vybrané soubory plus soubory uvedené ve spodním panelu. Kdykoli v každém panelu vyberete jeden soubor, klikněte na tlačítko Zobrazit k vyvolání náhledu na zvolený soubor. * Klikněte na Přidat k zařazení vybraných souborů do seznamu v dolním panelu, pokud chcete: * zpracovávat soubory z různých adresářů * zpracovávat soubory ve specifickém pořadí 3. Zvolte OK pro start zpracování souborů. Průběh je indikován na stavové liště. Pokud jste vybrali možnost rozpoznávání, aktuální stav rozpoznaného záznamu bude znázorněn v náhledovém okénku. 4. Na konci zpracování je zobrazena první zpracovaná stránka. Skenování (a volitelné rozpoznání) vytištěných dokumentů: 1. Chcete-li spustit zpracování předlohy z nástrojové lišty, zkontrolujte vybraný zdroj obrazu, musí to být skener, nikoli soubor. Mezi oběma možnostmi můžete přepínat kliknutím na první tlačítko zleva na hlavní nástrojové liště. 2. Umístěte stránku (stránky) ke skenování do Vašeho skeneru. Můžete skenovat v jednom chodu více stránek, máte-li automatický podavač stránek (ADF). 3. Startujte skenování s rozpoznáváním nebo bez rozpoznávání. * S rozpoznáváním: - Ujistěte se, že hlavní tlačítko pro zpracování ukazuje obraz vlevo a klikněte na něj, nebo - Vyberte Čtení>ze skeneru v menu zpracování. * Bez rozpoznávání: - Ujistěte se, že hlavní tlačítko pro zpracování ukazuje obraz vlevo a klikněte na něj, nebo - Vyberte Čtení>ze skeneru v menu zpracování. 4. Počkejte, až proběhne naskenování a zpracování stránek. Průběh je indikován na stavové liště. Pokud jste vybrali možnost rozpoznávání, aktuální stav rozpoznaného záznamu bude znázorněn v náhledovém okénku. 5. Nejsou-li již k dispozici další stránky, objeví se dialogové okénko s dotazem na skenování dalších stránek. Vyberte ANO, budete-li skenovat další stránky do stejného dokumentu, v opačném případě vyberte NE k ukončení operace. Zvolíte-li ANO, nejprve umístěte novou stránku(y) do skeneru. 6. Na konci zpracování se zobrazí první zpracovaná stránka. Přerušení operace a pokračování ve zpracování Pokud chcete přezkoušet, modifikovat, nebo kreslit zóny během zpracování vícestránkového dokumentu, nejprve zastavte program v požadovaném bodě. Po přerušení operace je na displeji obraz zpracovávané stránky. Můžete modifikovat/navrhovat zóny a měnit nastavení podle aktivních parametrů. Po přezkoušení, modifikování, nebo návrhu zón můžete znovu spustit zpracování stránky, nebo ukončit celou operaci a ponechat poslední načtenou stránku bez rozpoznání. - Další informace o tvorbě zón viz položky ”Práce se zónami” a ”Práce s tabulkovými zónami” v kapitole 4. Nastavení přestávek v programu po skenování/vložení obrazu: - Stiskněte tlačítko Zastavit pro zónování v hlavní nástrojové liště nebo - Vyberte Zastavit pro zónování v menu pro zpracování. - Stav tlačítka můžete změnit při přerušeném průběhu rozpoznávání. Zastavit v průběhu rozpoznávání: - Klikněte na tlačítko Přerušit v hlavní nástrojové liště (je k dispozici pouze během zpracování). Nové spuštění zpracování: - Stiskněte tlačítko Pokračovat v hlavní nástrojové liště, nebo - Vyberte Pokračovat v menu pro zpracování. Ukončení zpracování: - Klikněte na tlačítko Stop v hlavní nástrojové liště (je k dispozici pouze během stavu přerušení), nebo - Vyberte Stop v menu pro zpracování. - Všechny předchozí stránky zůstanou zachovány, otevřená stránka zůstane bez rozpoznání, ale její obraz bude uložen. Následující stránky se nebudou zpracovávat. Rozpoznávání obrazů v dokumentu Důvody, proč obrazy v dokumentu Recognita potřebují být (znovu) rozpoznávány: * Původně byly vloženy bez rozpoznání, protože byl zadán požadavek na manuální zónování. * Výsledky rozpoznávání jsou neuspokojivé vzhledem k nevhodnému nastavení (např. jazyka, slovníku, jasu atd.). * Výsledky rozpoznávání jsou špatné pro nesprávnou velikost/typ zóny, nebo špatnou orientaci obrazu a podobně. Máte možnost spustit nebo opakovat rozpoznávání: * Obrazu na běžné stránce * Všech obrazů * Všech nerozpoznaných obrazů stránek * Obrazů na vybraných stránkách Rozpoznání obrazu aktuální stránky: - Ujistěte se, že vícestavové tlačítko na editační nástrojové liště ukazuje tento obraz a klikněte na něj, nebo - Vyberte Rozpoznat>tuto stranu v kontextovém menu v obrazovém okénku. Rozpoznání obrazů na všech stránkách: - Ujistěte se, že vícestavové tlačítko na editační nástrojové liště ukazuje tento obraz a klikněte na něj, nebo - Vyberte Rozpoznat>všechny strany v kontextovém menu v obrazovém okénku. Rozpoznání dříve nerozpoznaných obrazů stránek: - Ujistěte se, že vícestavové tlačítko na editační nástrojové liště ukazuje tento obraz a klikněte na něj, nebo - Vyberte Rozpoznat>nerozpoznané strany v kontextovém menu v obrazovém okénku. Rozpoznání obrazů na vybraných stránkách: 1. Vyberte stranu(y) k rozpoznání ze seznamu Prohlížeče. 2. Vyberte Rozpoznat stranu(y) v kontextovém menu Prohlížeče. Práce s dokumenty Vytvořený dokument můžete dále zpracovávat různými způsoby, v závislosti na jeho obsahu, účelu a pracovních metodách. Dále je uveden přehled možností. Tvorba výstupu (viz další v této kapitole): * Uložit, nebo odeslat dokument. Můžete jej otevřít a pracovat na něm později. * Uložit, nebo odeslat část, nebo celý rozpoznaný text ve formátu, který si vyberete. * Uložit, nebo odeslat některé, nebo všechny obrazy ve zvoleném formátu. * Přetáhnout myší text a/nebo grafiku do dalších aplikací. * Vytisknout text a/nebo obrazy. Revidovat rozpoznaný text (viz kapitola 4): * Přezkoumat a editovat text manuálně. * Spustit funkci přezkoušení k vyhledání a opravě problémových míst v textu. * Je-li to nutné, zadat do programu učení znaků. Zónování pro nové rozpoznávání (viz kapitola 4): * Zkontrolujte automatickou tvorbu zón; podle potřeby je opravte. * Manuálně nakreslete zóny. * Vložte zónové šablony. Rozpoznání obrazů (viz předchozí část této kapitoly): * Proveďte rozpoznání (případně opakujte rozpoznání) vybraných nebo všech obrazů v dokumentu. Připojení nových stránek (viz první část této kapitoly): * Nové stránky vložte do libovolného místa v dokumentu. Tato příručka obsahuje samostatnou kapitolu ”Práce s dokumenty,” kde jsou uvedeny další podrobnosti. Bližší informace k výše uvedeným funkcím najdete také v Online nápovědě. Uložení dokumentů, textu a obrazů Po vytvoření dokumentu můžete uložit příslušný text a obrazy, a/nebo můžete dokument uložit jako soubor dokumentu Recognita. Text, obrazy a dokumenty Recognita můžete posílat elektronickou poštou. Tato sekce popisuje následující postupy: * Uložení a posílání dokumentů * Uložení a posílání textu * Použití složitějších nastavení pro textové výstupy * Uložení a odeslání obrazů stránek * Přetažení pomocí myši a použití Clipboardu Uložení a posílaní dokumentů Nedokončíte-li zpracování nasnímaného objektu hned po jeho vytvoření, měli byste své soubory dokumentu Recognita (známé pod názvem RCD soubory) uložit krátce po jejich vytvoření. Budou k dispozici pro pozdější úlohy a budete mít možnost použít funkce přezkoušení a učení. Vytvořené soubory RCD můžete posílat elektronickou poštou. Uložení dokumentu: 1. Klikněte na tlačítko Uložit dokument Recognita na hlavní nástrojové liště, nebo vyberte Uložit jako dokument Recognita ze souborového menu. Při uložení nového dokumentu se vyvolá dialogové okénko Uložit jako dokument Recognita. Zadejte adresář a název vašeho souboru RCD a klikněte na Uložit. 2. Během vaší práce pravidelně klikněte na tlačítko Uložit dokument Recognita, aby se průběžně ukládaly zadané změny. Rozpoznaný text pak můžete vyvolat v posledním uloženém stavu. Vyvolání textu v posledním uloženém stavu: 1. V seznamu Prohlížeče vyberte stránky k vyvolání požadovaného textu. 3. Z kontextového menu Prohlížeče vyberte Vyvolat uložené. 4. K zpětnému vyvolání celého dokumentu použijte příslušný příkaz pro vyvolání uloženého dokumentu v menu Soubor. Posílání dokumentu v příloze elektronické: - Zvolte Odeslat dokument Recognita ze souborového menu. Otevře se program elektronické pošty a nabídne novou prázdnou zprávu obsahující dokument v příloze. Uložení a posílání textu Po dokončení operace rozpoznávání bude Váš dokument Recognita obsahovat rozpoznaný text. Můžete jej uložit a odeslat v různých výstupních formátech podporovaných Recognitou Plus. Formáty můžete vybírat ze seznamu formátů v dialogových okénkách Uložit text(y) a Pošli text(y). Výstupní formáty mohou být setříděny do čtyř skupin : * Pouze textové formáty. Zahrnují různé formáty GWP a ASCII, které se navzájem liší pouze ve způsobu, jakým je zachován původní formát na základě stránkování, tabulátorů a mezer. * Tabulkové formáty a formáty slučitelné s tabulkovými generátory. Mezi ně počítáme tabulátory/čárkami/uvozovkami oddělené formáty ASCII, stejně jako nejčastěji používané formáty v tabulkových programech. * Formáty textových procesorů, do kterých může Recognita Plus konvertovat plně formátovaný text, se zachováním formátu stránky a včetně grafiky. * Formáty textových procesorů, do kterých může Recognita Plus převádět atributy formátování textu, ale pravděpodobně ne grafiku. Podle typu vašeho textového procesoru, programu DTP, nebo tabulkového procesoru se můžete rozhodnout, který textový formát je pro daný účel nejvhodnější. Uložení rozpoznaného textu: 1. Vyberte Uložit text jako z kontextového menu Prohlížeče. Objeví se dialogové okno Uložit text. * 2. Vyberte výstupní formát ze seznamu formátů. 3. Zvolte Rozšířené nastavení dle potřeby (viz další popis). 4. Zvolte umístění adresáře, zadejte jméno souboru a klikněte na OK. Odeslání rozpoznávaného textu v příloze elektronické pošty: 1. Zvolte Odeslat>Text ze souborového menu. Objeví se dialogový box Pošli text elektronickou poštou. 2. Zvolte výstupní formát ze seznamu formátů. 3. Možnost Rozšířené je rovněž k dispozici pro odeslání (viz další popis). 4. Zvolte OK. Program elektronické pošty zobrazí novou zprávu s textem v příloze. Použití rozšířeného nastavení pro textový výstup Kromě výběru vhodného výstupního formátu máte k dispozici řadu možností, jak zachovat zadané atributy formátování vašich textových dokumentů. Při uložení nebo posílání textu klikněte na Rozšířené k vyvolání štítkového dialogového okna s rozšířenou nabídkou parametrů pro uložení. * Nejprve můžete vybrat jeden ze tří formátů, který odpovídá třem hlavním úrovním zobrazení v zabudovaném editoru Recognity Plus. Tyto úrovně formátu jsou: * Plný formát: zachovává původní rozmístění na stránce, formátované texty a grafika jsou umístěny do rámečků. * Částečný formát: zachovává formátování znaků a odstavců. Text je bez sloupců. * Řádkový formát: zachovává text bez formátování. Text je bez sloupců. Každá z uvedených tří úrovní má vlastní nastavení formátů dokumentu, odstavců a znaků. Základní nastavení, které je vhodné pro většinu případů, je možné přizpůsobit. Pro plný formát, jsou nastavení předem zadaná s Automatickými hodnotami, v řádkovém formátu mnohé z nich nejsou k dispozici. Částečný formát je nejvhodnější pro přizpůsobení nastavení. Program nabídne určité stránky k uložení a odeslání. V nabídce možností můžete vybrat další stránky. * Vyvoláte-li uložení z menu souboru, v nabídce budou všechny stránky. * V kontextovém menu budou nabídnuty vybrané stránky. Můžete vytvořit jednostránkové nebo vícestránkové obrazové soubory obsahující černobílé, šedé, nebo barevné obrazy. Obrazy se uloží ve stejném formátu, v jakém jsou zobrazeny. Přehled kombinací je uveden v tabulce v nápovědě Online. Uložení a odeslání obrazů stránek Skenované obrazy jsou vždy vloženy do dokumentového souboru Recognita; aby se zabránilo duplicitnímu načtení obrazů na disk, je potřebné zadat obraz do souboru (v RCD), nebo uložit obraz s určením cesty. Druhou možnost můžete nastavit na obrazovém štítku v dialogovém okénku Možností. Bez ohledu na vybranou možnost můžete obrazy uložit v podporovaném formátu souborů. Obrazové soubory můžete rovněž poslat elektronickou poštou. Můžete vytvořit soubor s jedním obrazem, nebo vícestránkový obrazový soubor černobíle, nebo v odstínech šedi. Možné kombinace jsou shrnuty v tabulce v nápovědě Online. Uložení obrazů stránek: 1. Zvolte Uložit obraz jako ze souborového menu nebo Uložit obraz z kontextového menu Prohlížeče. Objeví se dialogové okno Uložit obraz: * 2. Zvolte výstupní formát ze seznamu formátů. 3. Dle potřeby zvolte Rozšířené parametry pro uložení stránek podle volby Jeden soubor pro každou stránku. 4. Zvolte cestu adresáře, jméno souboru a pak klikněte na OK. Odeslání obrazu stránky v příloze elektronické pošty: 1. Zvolte Odeslat>Obraz z menu souboru. Objeví se dialogové okno Odeslat obraz elektronickou poštou ze souborového menu. 2. Zvolte výstupní formát ze seznamu formátů. 3. Rozšířené nastavení je rovněž k dispozici, s vyjímkou Jeden soubor na stránku. 4. Zvolte OK. Program elektronické pošty zobrazí novou zprávu se zadaným obrazem v příloze. Vyberete-li více stránek, budou umístěny ve vícestránkovém obrazovém souboru. Vyberete-li jednostránkový formát, musíte odeslat každou stránku jednotlivě. Program standardně nabídne určité stránky k uložení a odeslání. V obou dialogových boxech můžete vybrat další stránky. * Zvolíte-li funkci uložení z menu souboru, v nabídce bude aktuální. * Při využití kontextového menu budou v nabídce stránky zadané pomocí funkce kontextového menu. Přetažení myší a použití Clipboardu (technika Drag-and-drop) Můžete vybrat určité části dokumentu Recognita pro přetažení myší, nebo kopírování do Clipboard. V textovém okénku si můžete vybrat z následujících položek pro přenos: * Část textu rozpoznaného uvnitř zóny. Použijte standardní metody výběru textu. * Všechen text na běžné stránce. Zvolte Vybrat stránku z kontextového menu obrazového okénka, nebo Vybrat text ze stránky v menu Editace. * Všechen text v dokumentu. Vyberte Vybrat text na všech stránkách v menu Editace. * Grafiku v rámečku textového okénka. Dvojitým kliknutím na rámeček obsahujícím grafiku zadáte výběr grafiky. Doporučujeme, abyste při tomto kroku přepnuli do plného formátu pro zviditelnění potřebného rozsahu. (Viz sekci “editace“ v kapitole 4 o třech typech zobrazení v editoru). V obrazovém okénku můžete vybrat libovolnou zónu dvojitým kliknutím na její obraz. Obsah vybrané zóny bude přenesen jako obraz. Spuštění rozpoznávání z jiných aplikací Program Recognita Plus může být zaveden do vašeho počítačového prostředí různým způsobem. Nabízeny jsou následující metody : * Přímé propojení do aplikace * Rozpoznávací nástroje v programu elektronické pošty * Podpora kontextového menu Prohlížeče * Přetažením myší z okna Prohlížeče. První dvě metody jsou možné během instalace, nebo spuštěním funkce Podpora nastavení programu Recognita Plus. Poslední metoda je přidaná automaticky. Přímé propojení do aplikací Je povoleno v Podpoře nastavení a dovolí vám vyvolat Recognitu Plus z lišty úloh, kdykoliv při práci s jinou aplikací. Rozpoznávaný text bude umístěn na pozici kurzoru. Přímé propojení: 1. Spusťte Vaši cílovou aplikaci a umístěte vkládací značku na pozici, kam si přejete umístit rozpoznaný text. 2. Klikněte na ikonu přímého propojení na liště úloh, obdržíte menu se dvěma položkami. * 3. Zvolte Rozpoznat ze souboru nebo Rozpoznat ze skeneru v tomto menu. Neběži- li Recognita Plus, bude spuštěna. 4. Proces rozpoznávání bude spuštěn podle vybraného menu. Okno Recognity Plus obsadí dolní část obrazovky. 5. Na konci rozpoznávání bude text vložen do označeného místa vkládání. Pro konverzi textu se uplatní částečný textový formát. Kliknutí pravým tlačítkem myši na ikonu přímého propojení zobrazí menu pro aktivaci dialogového okénka Možností Recognity Plus. Spuštění rozpoznávání na pozadí: 1. Po spuštění rozpoznávacího procesu zmenšete Recognitu Plus na ikonu. Počet stránek pro rozpoznávání je zobrazen na liště úloh Recognity Plus. 2. Blikající ikona indikuje, že rozpoznávání je dokončeno. Klikněte na ikonu pro aktivaci okna Recognity Plus. 3. Vyvolá se (Bude zobrazeno) okénko pro zprávy s dotazem na umístění značky pro( místa) vložení textu. 4. Pouze po umístění bodu vložení můžete zvolit OK v okénku pro zprávy. Funkce rozpoznávání na pozadí Vám umožní pracovat s dokumentem v průběhu rozpoznávání. Můžete také vytvořit nový dokument ve chvíli, kdy program žádá o umístění bodu vkládání. Nástroje rozpoznávání v programech elektronické pošty Recognitu Plus můžete použít ke čtení obrazových příloh ve zprávách došlých elektronickou poštou. Ke struktuře menu vaší elektronické pošty je připojeno nové dílčí menu Recognita Nástroje OCR. Podporovány jsou následující aplikace: * Microsoft Exchange * Microsoft Outlook * Lotus Notes Jsou dva základní způsoby, jak můžete provést rozpoznávání: * Čtení v součinnosti spustí Recognitu Plus (je-li nutné), což rozpozná všechny přílohy a umístí výsledek do dokumentu Recognita, připraven pro přezkoušení a uložení.. * Čtení bez interakce, běží na pozadí a přesměruje výsledky zpět do systému pošty jako přílohu ve formátu RTF, nebo jako základní text k nebo v odpovědi. Příklad menu Recognita Nástroje OCR: * Podpora kontextového menu v programu Explorer Do kontextového menu Explorer (přístupného rovněž na ploše) byla zařazena položka menu Rozpoznat. Tato volba je dostupná, pokud vyberete obrazový soubor následujícího typu: TIF, BMP, PCX, AWD. Použití kontextového menu programu Explorer: 1. Vyberte obrazový soubor v Prohlížeči nebo na ploše. 2. Vyberte Rozpoznat. To spustí Recognitu Plus (je-li to nutné). Recognita Plus zobrazí dialogové okénko Změnit nastavení je-li to nutné. 3. Klikněte na OK. Spustí se rozpoznávání. Čekejte až bude proces dokončen. 4. Na konci se zobrazí dialogové okénko Uložit text jako. Použijte okénka k uložení rozpoznaného textu. Recognita Plus zůstává aktivní. Přetažení myší z okna programu Explorer Vybrané obrazové soubory můžete přetáhnout do ikony, nebo do okna aplikace Recognita a bude-li nutné rozpoznávání, program Recognita se spustí. Operace rozpoznání obrazových souborů proběhne stejným způsobem, jako byste soubory otevírali příkazem z programu. Zpracování a uložení bez náhledu Můžete skenovat nebo vkládat obrazy, zpracovávat jejich obsah a uložit výsledek, přičemž dokument nebude zobrazen na displeji, ale bude automaticky uložen do jednoho, nebo více výstupních souborů vámi specifikovaného typu. Tato metoda se nazývá Uložení bez náhledu. Typicky ji můžete používat pro práce o vysokém objemu. Můžete uložit obrazy, text, nebo dokument Recognita. Nastavení možnosti Uložení bez náhledu - Zvolte Uložení bez náhledu v menu Zpracování. Změní se dvě možné ikony nástroje Zpracování pro indikaci tohoto zvláštního způsobu zpracování. Nástroj s rozpoznáváním se změní takto: - Nástroj bez rozpoznávání se změní takto: - - Novým kliknutím na tuto položku menu zrušíte zvolený způsob. - - - Použití volby Uložení bez náhledu: 1. Nastavte tento způsob zpracování, jak již bylo popsáno. 2. Spusťte zpracování. Objeví se dialogové okno podobné dialogu při uložení textu nebo uložení obrazu. Důležité: v tomto dialogovém oknu specifikujete možnosti uložení. Nezaměňujte s dialogovým oknem Otevření souborů. Okno Otevření souborů se vyvolá později, kdy program žádá o vložení obrazových souborů. 3. Specifikujte místo, jméno a ostatní náležitosti pro uložení vašich výstupních souborů. - Spustíte-li proces s rozpoznáváním, můžete zvolit textový formát, nebo formát dokumentu Recognita. - Spustíte-li proces bez rozpoznávání, můžete zvolit obrazový formát, nebo formát dokumentu Recognita. 4. Požadujete-li rozdělit příchozí stránky do několika souborů, klikněte na Možnosti, kde se dostanete do dokumentového štítku, kde můžete nastavit podmínky pro vytvoření nového dokumentu a změnit nastavení. * 5. Zvolte OK. Pokud jste požadovali zpracování obrazových souborů, bude zobrazeno dialogové okno pro Otevření souborů. Výstupní soubory budou generovány automaticky podle specifikovaného nastavení. Výstupní soubory budou označeny zadaným jménem souboru plus čtyřmístným číslem začínajícím standardně od 0001. Můžete vložit jiné počáteční číslo (uzavřené v hranatých závorkách), následované za jménem souboru. Nuly před číslem můžete vynechat. Např. pro čísla začínající od 200 zadejte název souboru takto: * vzor[200] * Základní přípona vybraného typu souboru se automaticky přiřadí při uložení daného souboru. Kapitola 4 Práce s dokumenty Recognita Plus nabízí řadu funkcí pro další zpracování vytvořeného dokumentu. Výběr možností a jejich použití závisí na uživateli a na charakteru úkolu, který musíte splnit. V této kapitole najdete informace o následujících položkách: * Práce se zónami * Práce se zónami obsahujícími tabulky * Opravy textů * Pohyb v dokumentech Recognita * Použití znakové mapy Práce se zónami Zóny jsou pravoúhlé útvary obsahující prvky tisku v obraze. Identifikují části stránky, jako je text nebo jiné prvky určené k rozpoznávání, nebo grafiku, která má být zachována bez rozpoznání. Části obrazu mimo zóny jsou v průběhu rozpoznávání ignorovány. Zóny a pořadí jejich čtení jsou zobrazeny na displeji obrazu. Na stránce může být aktivní v daném okamžiku pouze jedna zóna, která má v rozích a na všech stranách označená místa (záchytky) ovladače pro změnu velikosti zóny. Zónu můžete aktivovat kliknutím uvnitř zóny. Po skenování nebo vložení obrazu program analyzuje rozložení na stránce, identifikuje texty a grafiku a vytvoří zóny. Program rovněž určí pořadí čtení zón. Zóny můžete vytvořit také manuálně, nebo vložením šablony zón. Můžete nakreslit nové zóny, nebo modifikovat existující. Existuje šest typů zón, označujících určitý rozpoznávací nástroj, který bude zpracovávat zónu (obvykle a nejčastěji je to nástroj Omnifont). V zónách obsahujících text rozlišujeme mezi plynulým textem a zónami tabulek, rovněž mezi rozpoznáváním Jazykové sady (celou abecedou) a pouze číselnými znaky. Dohromady tyto prvky vytvářejí vlastnosti zóny. Tato sekce obsahuje následující položky popisující práci se zónami: * Automatické nebo manuální zónování * Základy manuálního zónování * Základy o vlastnostech zón * Základy o šablonách zón. Automatické nebo manuální zónování Můžete vyřadit automatické zónování, přejete-li si rozpoznávat pouze určité části dokumentu, nebo je-li rozmístění vašeho dokumentu příliš složité a předpokládáte-li, nebo zjistíte, že automatické zónování je nevhodné. - Pro potlačení automatické tvorby zón nastavte Vypnout rozklad při skenování na štítku v dialogovém okénku Předzpracování. Základy manuálního zónování Práce se zónami je možná pomocí nástrojové lišty a kontextového menu v obrazovém políčku. Tato položka popisuje zónování s využitím nástrojové lišty. Manuální tvorba zón: - Klikněte na obraz pro obdržení kurzoru ve tvaru kříže. Tažením myší nakreslete pravoúhlý čtyřúhelník. Zvětšení a pohyb zón: Tlačítka nástrojové lišty pro zónování: klikněte pro spuštění nového uspořádání zón Pro změnu pořadí zón: 1. Pro start nového uspořádání vyberte v položkách menu Přeskupení zón. 2. Klikněte na poslední správnou zónu, potom klikněte na další zóny v požadovaném pořadí čtení. Jakmile docílíte správného pořadí zón , ukončete výběr. 3. Klikněte znovu na nástroj Přeskupení zón, nebo klikněte mimo zónu pro ukončení nového uspořádání. Stisknutím Esc ukončíte zadání změny pořadí. Zrušení určité zóny: - Stlačením Del smažete aktivní zónu. Zrušení skupiny zón: - Stlačením Ctrl+Del smažete aktivní a všechny jí následující zóny. - Stlačením Ctrl+Shift+Del smažete aktivní a všechny jí předcházející zóny. Základní vlastnosti zón Základní nastavení zón je vhodné pro většinu úkolů rozpoznávání a obvykle není nutné, abyste měnili vlastnosti zón. Zóny mají následující vlastnosti: * Jeden z šesti rozpoznávacích nástrojů nebo grafiky * Textový tok: plynulý nebo v tabulce, pouze pro Omnifont, Bodovou matici a ručně psaná čísla * Povolené znaky: pouze čísla nebo jazyková sada (celá abeceda), pouze pro rozpoznávací nástroje Omnifont, Braille a bodovou matici. Vlastnosti jsou reprezentovány ikonami a barvou hraničních čar zóny. K zobrazení ikon nastavte Zobrazení vlastností ve štítku dialogového okénka Možností. Grafické zóny mají černé okraje a šedé šrafování, bez ikon. Bez ohledu na to, je-li zóna tvořena automaticky nebo manuálně, její vlastnosti jsou napoprvé určeny automaticky (viz další popis v této sekci). Podle potřeby můžete měnit kterékoli vlastnosti jednotlivých zón. Můžete nastavit základní vlastnosti zóny, které budou použity v pozdějším rozkladu v nástrojové liště, nebo na štítku Přesnost v dialogovém oknu Možností. * Pro individuální nastavení zón otevřete sadu nástrojů Vlastnosti zón, nebo použijte kontextové menu obrazového pole. Vlastnosti aktivní zóny jsou tučně orámovány. Klikněte na jinou možnost pro její uplatnění v aktivní zóně. Jak nastavuje vlastnosti zón program: * Grafika je vždy identifikována automaticky. * Rozpoznávací nástroj: - Rozložená zóna přebírá základní nastavení. Je-li nastavena automatika, bude vybrán jeden z nástrojů Omnifont, Bodová matice, Ručně psaná čísla nebo Čárový kód, na základě detekovaného obsahu zóny. - Manuálně nastavené zóny přebírají nastavení aktivní zóny. První zóna ve fázi kreslení přebírá základní nastavení, nebo Omnifont, je-li nastavení Automatické. * Povolené znaky (pro Omnifont a Bodovou matici): - Rozkládané zóny mají základní nastavení. - Manuálně tvořené zóny přebírají nastavení aktivní zóny. * Plynulý nebo tabulkový text je detekován automaticky. K vypnutí automatické detekce tabulek stiskněte klávesu Ctrl a podržte ji po dobu kreslení zóny. * Zónu typu Braille můžete nastavit jen pro celý dokument jako standardní zónu. Všechny existující zóny se změní na zóny typu Braille vyznačené červenými okraji (tabulky nejsou podporovány). Je možné zakreslit zóny manuálně, ale všechny zóny obsažené v dokumentu musí být pro Brailleovy znaky. Dostupná zůstává volba jazykové sady a volba Pouze čísla. Při automatickém rozkladu program zadá jednotlivé zóny typu Braille vždy v rozsahu celé stránky. Výsledkem bude editovatelný text, který odpovídá vstupnímu textu zapsanému Brailleovými znaky. V Online nápovědě je uveden seznam vhodných skenerů pro rozpoznávání Brailleových znaků. Základy zónových šablon Soubor zónových šablon obsahuje informace o skupině předdefinovaných zón (velikost, umístění, vlastnosti a pořadí rozpoznávání) pro jednu stránku. Zóny můžete uložit souboru šablon a opět vyvolat v případě potřeby. Šablonu můžete odložit zpět, např. pokud omylem zavedete jinou šablonu. Šablony zón jsou užitečné chcete-li číst větší počet stránek, nebo několik dokumentů se stejným formátem. Je-li vložena šablona, není prováděn automatický rozklad pro nově příchozí obrazy. Program automaticky dorovnává určitý stupeň nepřesnosti zónových šablon, který může vznikat lehkým posunem skenovaných stránek. Kliknutí pravým tlačítkem myši do pole šablony ve stavové liště zobrazí kontextové menu s příkazy použitelnými pro danou šablonu. Vytvoření souboru šablony: 1. Nakreslete, nebo přezkoušejte všechny zóny a dle potřeby nastavte jejich vlastnosti. 2. Zvolte Uložit šablonu z menu soubor nebo Uložit v kontextovém menu. Objeví se dialog pro uložení šablony. 3. Zadejte jméno pro soubor šablony a uložte jej. Pro vložení souboru šablony: 1. Zvolte Načíst šablonu z menu souboru, nebo Načíst šablonu z kontextového menu. Objeví se dialogový box pro vložení šablony. 2. Vyberte soubor šablony pro vložení a zvolte Načíst. Je-li otevřen dokument, objeví se dialogový box Použít šablonu. * 3. Zvolte jednu ze tří možností k zavedení šablony na požadované stránky. Po vložení šablony do otevřené stránky, nebo do všech stránek dokumentu, se zruší původní zóny a nahradí se zónami nastavenými v šabloně. * Není-li otevřen žádný dokument, vložená šablona bude aplikována na nově příchozí stránky. Pro odstranění souboru šablony: 1. Zvolte žádná šablona z menu souboru, nebo žádná šablona v kontextovém menu. 2. Má-li být šablona odejmuta z otevřeného dokumentu, objeví se dialogové okénko Odstranit šablonu: * 3. Zvolte jednu ze dvou možností. Zvolíte-li první možnost, všechny šablonové zóny budou odstraněny ze všech stránek dokumentu, kde neproběhla editace zón. Potřebujete-li odstranit šablonu jen z jediné otevřené stránky, můžete editovat a vymazávat zóny. Není-li otevřen žádný dokument, nově příchozí stránky budou rozkládány, pokud bude tato funkce aktivní. Nová verze programu nabízí dvoustránkové šablony pro snadnější zpracování dvoustránkových formulářů anebo knih. V šabloně se uloží dva vzory zóny, které můžete později aplikovat na stránky jdoucí za sebou. Postup při zadání dvoustránkové šablony je takový, že nejprve připravíte potřebné zóny na dvou po sobě následujících stránkách, první zónu aktivujete, zvolíte příkaz Uložit šablonu a zaškrtnete volbu pro dvě stránky. Práce s tabulkovými zónami Rozklad rozložení stránek automaticky rozlišuje mezi plynulým textem a tabulkami. Je-li identifikována tabulka, obraz textu je obsažen v tabulkové zóně. Tabulky jsou rovněž automaticky detekovány při manuální tvorbě zón, pokud není stištěna klávesa Ctrl. Tabulky jsou označeny modrou mřížkou přes obraz. Pro přepnutí mezi plynulým textem (červené ohraničení) a tabulkovou zónou (modré ohraničení), klikněte na vlastnosti zóny uprostřed editační lišty. Slouží také k zobrazení vlastností aktivní zóny. V tabulce jsou horizontální linky mřížky vždy přes celou šířku tabulky a nemohou být zkráceny. Vertikální linky mřížky nemusí být vždy uplatněny na plnou výšku tabulky. * Můžete editovat tabulkové linky uvnitř aktivní tabulkové zóny. Tuto úpravu lze provést v obrazovém poli před spuštěním (znovu) rozpoznávání. Pokyny pro editaci tabulek: * Definičně je povoleno modifikovat mřížku tabulky, Standardní nastavení programu umožňuje krácení mřížek, což usnadňuje připojování svislých linek, které nedosahují přes celou výšku tabulkové zóny. Stisknutím Alt nebo obou tlačítek myši je umožněn jemný pohyb. * Tlačítko Ctrl omezuje pohyb, vkládání a rušení vodorovných čar mřížky na určitém řádku. * Při stisknuté klávese Ctrl a přetažením myši na sousední řádky rozšíříte aktivní pole pro vkládání a vymazání. * Nemůžete vkládat mřížkové linky příliš blízko stávajícím. Tato situace je indikována speciálním kurzorem zákazu. Editaci tabulek můžete provádět pomocí editační nástrojové lišty, nebo kontextového menu obrazového pole. Tabulková zóna musí být aktivována před jakýmkoliv editováním mřížek tabulky. Kliknutím uvnitř zobrazené zóny tuto zónu aktivujete. Tlačítka nástrojové lišty pro editaci tabulek: * Posun mřížek tabulky: - Linku mřížky uchopíme kurzorem a přetáhneme ji na jinou pozici. - Vložení mřížkových čar: 1. Klikněte na nástroj Vložit sloupce nebo Vložit řádky, nebo použijte kontextové menu k vyvolání kurzoru pro vkládání. 2. Přesuňte vkládací kurzor na požadovanou pozici a klikněte pro vložení mřížkové čáry (oddělovače). Opakujte podle potřeby. Stisknutím klávesy Tab přepínáte mezi horizontálním a vertikálním kurzorem. 3. Pro návrat k normálnímu kurzoru klikněte mimo zóny, nebo stiskněte Esc. Rušení mřížkových čar: 1. Klikněte na Zrušit řádky/Sloupce, nebo použijte kontextové menu k vyvolání kurzoru pro rušení - 2. Pro návrat k normálnímu kurzoru klikněte mimo zóny, nebo stiskněte Esc. Zrušení všech mřížek: - Klikněte na Zrušit všechny řádky a sloupce v liště Editace, nebo použijte příkaz kontextového menu. Tato funkce vymaže všechny mřížky v aktivní tabulkové zóně. Zóna si zachová své tabulkové vlastnosti, můžete potom nakreslit vlastní tabulkovou mřížku. Opravy textu Po rozpoznávání je rozpoznaný text uložen v dokumentu Recognita a zobrazen v textovém poli. Mezi normálně rozpoznanými znaky můžete vidět následující barevně odlišené položky: * Nejasné znaky: znaky označené během OCR jako nejisté se vyskytují žlutě. * Znaky, které nejsou ve slovníku: jsou zvýrazněny zeleně, platí zde podmínka, kdy hlavní jazyk pro rozpoznávání má aktivní modul pro jazykovou analýzu. Zvýraznění bude odstraněno, změníte-li takové slovo, nebo v průběhu kontroly povolíte slovo beze změny. * Odmítnuté znaky, které program nemohl identifikovat jsou reprezentovány červenou vlnovkou ( ~ ). * Ztracené znaky (zřídka), které nejsou obsaženy v automaticky zvolené kódové stránce při spuštění programu Recognita Plus, jsou fialové. To se může stát pouze v případě, je-li povoleno několik jazyků a žádná ze standardních kódových stránek Windows nepokrývá všechny jejich znaky. * Znaky po učení jsou znaky změněné na základě učení a jsou modré. Zbarví se během procesu učení. K vyhledání uvedených znaků a zadání oprav se nemusíte spoléhat jen na vlastní zrak, ale můžete využít nástrojů nabízených Recognitou Plus. Jsou to: * Interní editor odpovídající standardním postupům editace * Přezkoušeče pro porovnání textu a jeho přiřazeného obrazu * Kontrolní nástroj k vyhledání problematických znaků a slov * Uživatelské slovníky pro přezkoušení * Učení pro špatně rozpoznané znaky Zvýraznění nejasných znaků a neslovníkových slov se odstraní při opravě slova v průběhu přezkoušení, nebo přepsáním z klávesnice. Editace Recognita Plus má vlastní interní WYSIWYG editor obsahující jak tradiční, tak pro OCR specifické možnosti. Je schopný zobrazit text včetně jeho formátovacích atributů dodaných nástrojem OCR. Má tři hlavní způsoby zobrazení plus čtvrtý speciální. Jsou to: * Plný formát: tento způsob zachovává originální rozmístění stránky, jak formátovaný text, tak i grafika jsou zobrazeny v rámečcích. * Částečný formát: zobrazuje pouze znakové a paragrafové formátování. Text není zobrazen ve sloupcích. * Řádkový formát (Drop): zobrazuje text pouze v řádcích bez formátování. * Základní (náhledový) typ zobrazení bez formátu (zřídka používaný): zobrazuje text v proporcionálním fontu s konstantní roztečí, který Recognita Plus standardně používá k zobrazení neformátovaného textu. V tomto režimu se simultánně zobrazí všechny znaky, které je Recognita Plus schopna rozpoznat. To může být užitečné pro zobrazení textu v případě, kdy požadovaný font není instalován ve vašem prostředí Windows 95 nebo Windows 98. Zobrazení textu v plném, částečném nebo řádkovém formátu: - Klikněte na příslušné tlačítko na levém spodním okraji textového pole, nebo - Zvolte Text Formát>Plný (Částečný nebo Drop) v menu Editace. Zobrazení textu v režimu bez formátu (draft mode). - Zvolte Režim bez formátu v menu Editace. Zobrazení textu v rozdílném zvětšení: - Zvolte potřebné procento velikosti z menu Zobrazení, nebo z kontextového menu textového pole. Změny v textu: - Program podporuje většinu standardních textových editačních technik. K editaci textu můžete používat vyříznutí, kopírování a vložení, nebo přetažení myší. - Použijte editační lištu pro změnu formátování znaků. - Pro formátování odstavců použijte editační lištu a měřítko. Je nutné dodržovat pravidlo, abyste veškeré operace přezkoušení a učení v rozpoznaném textu prováděli před celkovou editací, protože propojení mezi textem a obrazem nefunguje u editovaných znaků. Editace tabulek Po rozpoznání tabulkové zóny můžete editovat jak mřížky, tak jejich obsah v textovém poli. Recognita postupuje podle standardních konvencí pro editaci tabulek. Následující obrázek obsahuje přehled metod výběru buněk a přesunů mřížek: Přetažením myší můžete rozšiřovat výběr na sousední řádky, sloupce a buňky. Pro editaci buněk použijte možnosti v kontextovém menu: * Použijte Rozdělit buňky pro rozdělení všech vybraných buněk na dvě části.Tato možnost je vhodná pro vložení prázdného sloupce vpravo od vybraného sloupce. * Použijte Sloučit buňky k sloučení všech vybraných buněk v řádku. * Použijte Vložit řádky pro vložení prázdných řádků před vybrané řádky. Vloží se stejný počet řádků, jako je počet vybraných řádků. * Použijte Zrušit řádky k smazání vybraných řádků. Další rady pro editaci: * Pro vložení nové řádky na konci tabulky klikněte na spodní pravou buňku a stiskněte klávesu Tab. * Umístění tabulátoru do buňky proveďte pomocí Ctrl+Tab. * Pomocí Del smažete obsah vybrané buňky. Přezkoušeče Recognita Plus přiřazuje rozpoznané znaky jejich původnímu obrazu. Přezkoušeče slouží k zobrazení obrazů a k usnadnění oprav v textu. Přezkoušeče můžete aktivovat nebo vypnout přepínačem pro zobrazení v dialogovém oknu Možností. Přezkoušeč obrazového okna můžete aktivovat společně s překryvným, nebo s dynamickým přezkoušečem. Překryvný přezkoušeč: V textovém oknu dvakrát klikněte na znak, který chcete zkontrolovat. Obraz zvoleného znaku nebo mezery se vyvolá uprostřed okna přezkoušeče a bude vyznačen červenou barvou. Okno uzavřete kliknutím mimo plochu okna. Dynamický přezkoušeč: Okno dynamického přezkoušeče vyvoláte kliknutím v textu. Zobrazení je stejné jako u překryvného přezkoušeče, ale aktuálně se mění obsah okna podle probíhající editace. Přezkoušeč obrazového okna: Obraz vybraného znaku textového okna se v obrazovém oknu přezkoušeče objeví v modrém rámečku. Obraz sleduje aktuální pozici při editaci. Můžete měnit zvětšení obsahu okna a zobrazit větší nebo menší část kontextu. Obrázek znázorňuje dva aktivní přezkoušeče: * Přezkoušení Recognita Plus má speciální vyhledávací a substituční nástroj pro přezkoušení rozpoznávaného textu. To vám usnadní nalézt a nahradit: * Nejasné znaky (zelené) * Slova, která nejsou ve slovníku, označená během rozpoznávání (zvýrazněná žlutou barvou) * Odmítnuté znaky ( červená vlnovka, standardně) * Znaky zaměněné při učení (modré) * Uživatelem definované řetězce znaků (tj. často špatně přečtené páry znaků). Jazyk pro přezkoušení a různé podmínky pro zastavení mohou být nastaveny na štítku Přezkoušení obsaženém v dialogovém okénku Možnosti. Předem nastavený jazyk pro přezkoušení je stejný jako jazyk pro rozpoznávání. Můžete jej změnit před přezkoušením, nebo v průběhu přezkoušení, např. pro různé části vícejazyčného dokumentu. Když proces přezkoušení dospěje ke konci stránky a je vložena nová stránka, opravená stránka bude označena jako přezkoušená. To je indikováno zaškrtnutím ve sloupci Přezkoušeno v Prohlížeči. Stránka označená jako přezkoušená bude při příštím přezkoušení vynechána. Manuálně můžete přepnout příznak přezkoušení zvolením Změnit příznak přezkoušení z kontextového menu Prohlížeče. Při dalším přepnutí příznaku přezkoušení se znovu zobrazí a označí nejasné znaky a neslovníková slova pro nové přezkoušení. Spuštění (a zastavení) operace přezkoušení: - Klikněte na lištu Přezkoušení v hlavní nástrojové liště nebo zvolte Přezkoušení z menu editace. - Dialogová lišta přezkoušení se objeví ve spodní části textového okénka. Nalezení problematického místa v textu: - klikněte na Najít další na dialogové liště přezkoušení. Je-li to povoleno, přezkoušeče jsou automaticky aktivovány na nalezených položkách. * Oprava nalezených slov s použitím dialogové lišty přezkoušení: - Zvolte jeden z návrhů ze seznamu a klikněte na Změnit (tato možnost je aktivována, je-li vybrán jazyk pro přezkoušení). - Zadejte požadovanou změnu do pole Změň na a klikněte na Změnit, nebo. - Klikněte na Přidat pro vložení navrhovaného, nebo opraveného slova do uživatelského slovníku. Bližší informace o uživatelských slovnících viz položku “Uživatelské slovníky” dále v této kapitole. - Kliknutím na Učení je učením pro nalezené položky. Detaily o učení jsou uvedeny v části “Učení pro znaky” dále v této kapitole. - Můžete vybrat Změnit vše namísto Změnit pro náhradu všech výskytů neslovníkového slova, nebo řetězce s opravou tohoto slova v celém dokumentu. Oprava nalezených slov s využitím editoru: - Po vyhledání slova stiskněte Esc pro přemístění značky vkládacího místa z lišty přezkoušení do slova v textovém poli pro jeho editaci. Je-li otevřen seznam s návrhy, stiskněte dvakrát Esc. Návrhy pro libovolné slovo v editoru: - 1. Start přezkoušení. 2. Vyberte slovo v editoru, pro které chcete obdržet návrh. Tlačítko Přidat se změní na Návrh. 3. Klikněte na Návrh pro obdržení návrhu. Uživatelské slovníky Kromě hlavního slovníku, který můžete používat v průběhu rozpoznávání a přezkoušení, můžete vytvořit uživatelské slovníky přidáním slov v průběhu přezkoušení. Uživatelské slovníky mohou být uloženy pro příští použití podle potřeby můžete vyvolat určitý slovník pro práci s určitým dokumentem. Není-li vyvolán žádný uživatelský slovník, přidaná slova budou uložena v paměti do doby jejich uložení. Informace vyvolané, nebo uložené v paměti slovníku budou použity jak pro rozpoznávání, tak pro přezkoušení. Jméno a stav právě vyvolaného uživatelského slovníku jsou zobrazeny na stavové liště. Kliknutím na pravé tlačítko myši v poli uživatelského slovníku na stavové liště zobrazí kontextové menu s instrukcemi pro slovník. Editace uživatelského slovníku: 1. Vyvolejte uživatelský slovník. (Můžete rovněž editovat slovníková slova přidaná během přezkoušení, která ještě nejsou uložená.). 2. Zvolte Editace uživatelského slovníku z editačního menu. Objeví se dialogové okénko pro editaci uživatelského slovníku. * 3. Pro vložení slova napište nové slovo do textového okénka na spodním okraji obrazovky seznamu a klikněte na Vložit. 4. Pro zrušení slova vyberte nové slovo ze seznamu a klikněte na Zrušit. Přidání slov do uživatelského slovníku během přezkoušení: - Zvolte Vložit v dialogové liště přezkoušení podle výše uvedeného popisu. Uložení/vložení/odložení uživatelského slovníku: - Zvolte příslušnou položku menu z kontextového menu, nebo z submenu Uživatelského slovníku v souborovém menu. - Uživatelské slovníky mohou být rovněž vloženy a odloženy kliknutím na tlačítko s třemi tečkami (‘…’) na štítku Přesnost v dialogovém okénku Možnosti. Učení Učení je proces, který přiřazuje znakové křivky (obrazy) znakům, které reprezentují. Učení může probíhat až následně po rozpoznávání na znacích v Omnifontu nebo v Bodové matici. U většiny znaků není potřeba startovat proces učení. Jako pravidlo doporučujeme provádět učení na znakových křivkách, které jsou opakovaně špatně rozpoznávané, nebo zůstávají nerozpoznané. Jinak řečeno, neprovádějte učení na jednotlivých znacích, které jsou chybné např. pro náhodnou tečku u znaku v obraze. Můžete rovněž provádět učení na zvláštních znacích a symbolech. Učení může být uloženo do učebního souboru pro budoucí použití a vkládáno, kdykoliv je zapotřebí. Nebyl-li vložen žádný učební soubor, všechny nové informace o učení jsou uloženy v paměti do doby jejich uložení. Vložené, nebo nové učení bude použito při rozpoznávání. Učební soubor můžete uzavřít, pokud s ním nebudete v otevřeném dokumentu dále pracovat. Je možná kontrola a editace učebních souborů. Název a stav otevřeného učebního souboru jsou zobrazeny na stavové liště. Je-li prováděno učení na znakové křivce, program provádí následující: * Opraví výskyt znaku použitého pro učení. * Prohlédne stejnou stránku směrem dále dolů a ověří výskyt křivek podobných té, na které bylo prováděno učení. * Předloží navrhované změny uživateli pro potvrzení. * Opraví všechny výskyty podobných znaků, pokud to uživatel potvrdí. Doporučení pro učení: * Vždy začínejte učení na začátku stránky. * Používejte učení pouze pro malý počet stránek. Učení zvyšuje přesnost rozpoznávání na dodatečně dodaných a rozpoznávaných stránkách. * Používejte separátní učební soubory pro různé typy dokumentů. * I když soubor učení neuložíte, může funkce učení urychlit přezkoušení. Kliknutím na pravé tlačítko myši v poli učení na stavové liště se zobrazí kontextové menu s příkazy pro učební soubory. Učení na znacích: 1. Pro zahájení učení máte následující možnosti : - Kliknutí na Učení na liště přezkoušení, pokud chcete provést učení na nalezené křivce, nebo - Pravé kliknutí na znaku, nebo vybraném slovu v editoru a výběr Učení z kontextového menu. Objeví se dialogové okénko pro učení: * 2. Vložte správný znak do textového okénka a stiskněte Učení. 3. Je-li znak s podobnými křivkami nalezen na stejné stránce, objeví se dialog pro přezkoušení učení. * 4. Přesvědčte se, že všechny navrhované změny jsou správné. Některé nemusí být odpovídající vlivem podobných křivek pro různá písmena. (Např: ‘b’ a ’h’, ‘q’ a ‘g’, atd.). Máte následující možnosti: - Jsou-li všechna slova správná, klikněte na OK. Navrhované změny budou provedeny, změněné znaky budou označeny modře. - Je-li pouze málo nesprávných návrhů, vyberte nesprávné slovo a klikněte na Opakované učení. Objeví se dialogové okénko pro učení a můžete znovu provést učení tohoto výskytu. Podle potřeby opakujte tento krok a při dokončení klikněte na OK. - Pokud je mnoho nabídek nesprávných, nepoužívejte ani OK, ani Opakované učení, ale Zrušit. Učení tohoto znaku bude přerušeno. Uložení/vložení/odložení učení: - Zvolte příslušnou položku z kontextového menu, nebo z submenu Učení v souborovém menu. - Učební soubory mohou být rovněž vloženy a odloženy kliknutím na tlačítko s třemi tečkami (‘…’) na štítku Přesnost v dialogovém okénku Možnosti. Kontrola/editace učení: 1. Vložte učební soubor (Rovněž můžete editovat neuložené učení). 2. Zvolte Editaci souboru učení z editačního menu. Objeví se dialogový box Editace učebního souboru. 3. Zobrazí se naučené křivky a přiřazené znaky. Můžete vložit nový znak pro křivku a smazat nežádoucí. Pohyb v dokumentech Recognita Recognita Plus zobrazuje jednu stránku dokumentu Recognita v daném čase, nazývá se běžná stránka. Pro postupnou, nebo náhodnou změnu stránek můžete použít stránkový Prohlížeč. Další nástroje vám pomohou nalézt určitou stránku v dokumentu. Pro lepší orientaci mohou být zobrazeny stručné informace o stránce. Můžete snadno kopírovat, nebo přesunovat stránky uvnitř dokumentu, nebo mezi dokumenty. Tato sekce popisuje jak pracovat s vícestránkovými dokumenty. Zahrnuje následující položky: * Změna stran * Použití Prohlížeče * Nalezení stránek a textu Změna stránek Pro změnu stránek můžete použít tlačítko v levém horním rohu každého okna dokumentu. Pro použití klávesnice viz nápovědu online. Textové okénko uprostřed ukazuje číslo běžné stránky. Vložte nové číslo požadované stránky a stiskněte Enter pro pohyb na požadovanou stránku. Stisknutím Esc přerušíte pokyn k vyhledání stránky. Použití Prohlížeče Prohlížeč zabírá levé, nebo spodní okno v obrazovce dokumentu Recognita. Sestává ze dvou částí. Levá část zobrazuje malý náhled obrazu stránky, pravá obsahuje seznam Prohlížeče s řádky, kde každý představuje jednu stránku. Prohlížeč můžete využívat pro mnoho úkolů. Kromě zobrazení informací o stránkách můžete použít jeho kontextové menu k zadání příkazů. Většina příkazů se vztahuje k vybrané stránce, např. nové rozpoznávání, otevření a rušení stránek, ukládání textu a obrazů, vyhledání textu atd. * Následuje popis možností Prohlížeče: * Přesun a kopírování stránek je užitečné v případech špatného pořadí stran. - Přesun stránek do jiného místa uvnitř stejného dokumentu. - Přesun, nebo kopírování stránek do jiného dokumentu. * Rychlé zobrazení rozpoznávaného textu, můžete toho využít pro rychlý pohled na výsledky rozpoznávání, bez změn stránek. * Připojení poznámek ke stránce, později můžete nalézt stránky obsahující dané klíčové slovo ve sloupci pro poznámky. Přesun/kopírování stránek: 1. Vyberte stránky ke kopírování/přesunu ze seznamu Prohlížeče. Použijte standardní výběrové metody. 2. Klikněte na vybranou položku a podržte stisknuté tlačítko myši. Přetáhněte stránky do cílového místa ve stejném nebo jiném dokumentu. Pro kopírování stránek do jiného dokumentu ponechte stisknutou klávesu Ctrl při uvolnění myši. Cílové místo je trvale označeno ikonou, jak je zde znázorněno v obrázku. Vybraná stránka je přesouvána, ikona rozevřené stránky indikuje aktuální cílové umístění. 3. Uvolněte myš v požadovaném místě. Rychlé zobrazení rozpoznaného textu: 1. Upravte sloupce Prohlížeče tak, aby byl vybrán sloupec rozpoznaného textu. 2. Aktivujte pole stránkového Prohlížeče kliknutím na kteroukoliv jeho část. 3. Přesuňte kurzor do sloupce rozpoznaného textu a ponechte jej tam. Rozpoznaný text (v možném rozsahu) se objeví ve vnořeném okénku podobně jako nástrojová nápověda. Posunem z řádku na řádek můžete snadno a rychle vidět text na mnoha stranách. Připojení poznámek ke stránkám: 1. Upravte sloupce Prohlížeče tak, aby byl vybrán sloupec poznámek. 2. Máte dvě možnosti: - Zvolte řádek požadované stránky a klikněte na pole poznámky, nebo stiskněte F2 pro možnost zadání textu poznámky. - Zvolte Editace poznámky z kontextového menu Prohlížeče pro zobrazení dialogového okénka pro editaci poznámky. Nalezení stránek a textu Můžete vyhledávat stránky obsahující určitý řetězec v poli poznámky, nebo nalézt řetězec v rozpoznaném textu snadno a rychle, bez otevření stránek. Vyberete-li stránky v Prohlížeči a spustíte vyhledávání z kontextového menu Prohlížeče, budou prohledány pouze vybrané stránky. Není-li zadán výběr stránek, budou prohledány všechny stránky. Nalezení stránek s daným řetězcem v jejich poznámkovém poli: 1. Zvolte Najít>v poznámkách z editačního menu, nebo z kontextového menu Prohlížeče. Objeví se dialogové okénko Najít poznámky. * 2. Vložte řetězec a klikněte na Najít další. V Prohlížeči bude vybrána první stránka, jejíž pole poznámky obsahuje daný řetězec. Dle potřeby opakujte postup k vyhledání dalších řetězců. 3. Klikněte na Výběr vše pro výběr a zvýraznění všech stránek obsahujících řetězec ve své poznámce (např. připravené k přetažení do nového místa). Rychlé nalezení řetězce v rozpoznávaném textu: 1. Zvolte Najít>v textu v editačním menu, nebo v kontextovém menu Prohlížeče.Objeví se dialogový box Najít v... * - 2. Vložte řetězec a klikněte na Najít další. Je-li nalezen, program zobrazí zvýrazněný text obsahující řetězec. Je-li text nalezen na běžné stránce, editor rovněž zvýrazní výskyt. Stránky obsahující vyhledávaný text budou otevřeny, jen pokud kliknete na Otevřít stránku, nebo pokud je nastavena možnost Otevřít stránky automaticky. Užití znakové mapy Znaková mapa je malé vnořené okno zobrazující tabulku znaků. Má dvě formy: * Zobrazení všech 464 znaků, které Recognita Plus dokáže rozpoznávat. Obvykle vidíte tuto tabulku. Používejte ji pokud chcete vložit znaky do textového pole, nebo do určitých textových okének v dialogových boxech. Je to užitečné zejména pokud chcete vložit speciální symboly nebo znaky, které nejsou na klávesnici, např. pro učení, vyhledávání atd. * Zobrazení znaků a kódových hodnot vybrané kódové stránky: ve štítku znaků v dialogovém okénku rozšířených parametrů pro uložení, uvedeno pouze pro informaci. Kódy vám umožní vytvořit uživatelsky definovanou kódovou stránku. Zobrazení znakové mapy: - Klikněte na nástroj Znaková mapa v editační nástrojové liště, nebo vyberte Znakovou mapu v dialogových okénkách, kde je dostupná. * Vložení znaku ze znakové mapy: 1. Vložte vkládací bod na požadované místo (v textovém poli, nebo textovém okénku dialogového okénka). 2. Klikněte na znak, který chcete vložit. Můžete vložit libovolný znak bez ohledu na jeho aktuální stav (barvu). Kapitola 5 Zvýšení přesnosti rozpoznávání Úspěšné rozpoznávání závisí hlavně na dvou podmínkách: na kvalitě vašeho dokumentu a nastavení Recognity Plus. Tato kapitola vám poskytne některé praktické rady a dozvíte se, která nastavení jsou nejdůležitější k získání nejvyšší možné přesnosti. Vaše praktická zkušenost je přinejmenším stejně důležitá jako správné nastavení, protože i nejlepší software bez této zkušenosti nemůže pracovat. V této kapitole jsou uvedeny informace o následujících položkách: * Nastavení skeneru * Jazyky a jazyková analýza * (Vyhledávání) Řešení chyb přesnosti Nastavení skeneru Skener může být nastaven na štítku Skener v dialogovém okénku Možnosti, nebo ve vlastním uživatelském rozhraní TWAIN, pokud byl ovladač TWAIN (BasicScanner) zvolen při instalaci nebo v průběhu nastavení. Jas může být rovněž nastaven na liště Možnosti. Parametry nastavení se mohou lišit podle různých modelů skenerů. Nejdůležitější z nich jsou: * Jas * Rozlišení * Způsob skenování. Nastavení správného jasu Správné nastavení jasu nesmí znakům ani přerušovat kontury, ani slévat jednotlivé znaky do sebe. Pro dokumenty dobré kvality dává základní hodnota (obvykle 50%) dobré výsledky. Kvalitu skenovaného obrazu můžete přezkoušet v obrazovém poli s nastavením lupy na maximum. Příklad obrazů skenovaných s rozdílným nastavením jasu: Vaším cílem, přirozeně, je dosáhnout optimální kvality obrazu, přestože to není vždy možné. Recognita Plus do určité míry toleruje přerušené linky a slité znaky, nemusíte tedy věnovat přílišnou pozornost nepřesným znakům. I v případě, kdy je kvalita obrazu špatná, můžete dosáhnout lepší přesnosti pomocí jazykového analyzátoru. Viz následující část této kapitoly pro bližší informace o nastavení podmínek pro jazyk. Nastavení správného rozlišení Nastavení správného rozlišení je důležité pro získání dobrých výsledků skenování. Základem pro skenování je nejen kvalitní dokument, ale i následující doporučené nastavení: * 300 dpi pro písmo větší než 8 bodů, * 400 dpi pro písmo menší, nebo rovné 8 bodům Nenastavujte rozlišení vyšší než 400 dpi; můžete tím způsobit více škody než užitku. Zkontrolujte rozlišení vašeho obrazového souboru. Zobrazení rozlišení aktivujte ve sloupci rozlišení v seznamu Prohlížeče. Výběr vhodného způsobu skenování Recognita Plus má čtyři základní způsoby skenování, z kterých si můžete vybrat: * Skenování černobílé (B/W): nejčastěji používané. Skenuje černobíle s daným nastavením jasu. Tento typ skenování je vhodný pro dokumenty s přijatelnou anebo dobrou kvalitou. * Skenování černobílé (B/W) s automatickým nastavením jasu: skenování probíhá v šedé barvě s použitím softwaru pro optimalizaci obrazu poskytovaného skenerem, nebo se používá vlastní funkce Recognity k získání optimálního černobílého obrazu. Šedý obraz není zachován. Vybírejte toto nastavení pouze pro dokumenty špatné kvality, kde se kontrast mění běhen jedné stránky, nebo se na každé stránce liší. * Skenování v šedých odstínech: tento způsob se používá především tam, kde je obraz v odstínech šedi zahrnut pro zobrazení a export dokumentu Recognita. Při použití tohoto způsobu lze dosáhnout optimálního černobílého obrazu, podobně jako pro černobílé skenování s automatickým nastavením jasu. * Skenování v barvách: tato možnost je dostupná, jestliže instalovaný skener podporuje snímání barev. Barevné obrazy lze zobrazit v obrazovém oknu a v oknu Prohlížeče. Barevné obrazy můžete vytisknout, odeslat, nebo uložit do obrazových souborů. Při skenování v barevném režimu budou grafické zóny v textových souborech také zobrazeny barevně, jestliže je nastaven Plný formát. Tyto obrazy můžete vytisknout barevně. Barevné obrazy můžete také odeslat v příloze elektronické pošty, nebo uložit do souboru, za předpokladu že platí nastavení Zachovat grafiku a je zvolen vhodný výstupní formát. Jazyky a jazyková analýza * V této části jsou uvedeny informace o následujících položkách: * Jazyky pro rozpoznávání * Jazyková analýza (s užitím slovníků) * Metody rozpoznávání Omnifont Jazyky pro rozpoznávání Je velmi důležité definovat sadu znaků povolenou pro rozpoznávání. Sadu znaků obvykle definujete nastavením jazyka vašeho vstupního dokumentu. Nastavení jazyka určuje, jak budou rozpoznávány znaky dokumentu. Jazyky pro rozpoznávání nastavíte v roletovém seznamu v liště Možností, nebo na štítku v dialogovém okénku Možností. * * Při nastavení jazyka přidáte znaky potřebné pro zvolený jazyk k sadě znaků povolených pro rozpoznávání. Všechny tyto znaky tvoří Jazykovou sadu. Nastavením více jazyků pro vícejazyčný dokument rozšíříte tuto sadu znaků. Interpunkční znaménka, číslice a další společné symboly jsou vždy povoleny. Jestliže vyberete několik jazyků, první zvolený jazyk bude nastaven jako hlavní jazyk rozpoznávání. Na pozici hlavního jazyka můžete vybrat jiný jazyk pomocí Ctrl a kliknutím na požadovaný jazyk. Jazyková analýza může proběhnout za předpokladu, že hlavní rozpoznávací jazyk má zadaný slovník. Hlavní rozpoznávací jazyk se také používá rovněž k vyhledání vhodné kódové stránky pro export textu. Předem definovaná sada číslic, zvaná Pouze čísla, je alternativou pro jazykovou sadu, pokud Váš dokument obsahuje pouze čísla, nebo téměř jenom čísla. Obě nastavení můžete rozšířit zadáním jednotlivých dodatečných znaků. Znaky povolené pro jednotlivé jazyky jsou přehledně uvedeny v položce Jazyky a diakritika v online nápovědě. Jazyková sekce nápovědy vám rovněž poradí, jak pracovat s vícejazyčnými dokumenty a jak používat kódové stránky pro export textu. Úprava seznamu jazyků Program Recognita Plus 5.0 obsahuje novou funkci pro úpravu seznamu jazyků. Dodaný program nabízí v nástrojové liště seznam šestnácti jazyků, které jsou vybaveny jazykovými analyzátori. Vyvolaný seznam můžete dále upravit: 1. V dialogovém oknu Možnosti přejděte k panelu Přesnost. 2. Klikněte na Výběr jazyků... k vyvolání abecedního seznamu všech 114 podporovaných jazyků. 3. Seznam můžete zkrátit tím, že z výběru vyloučíte některé zeměpisné oblasti. 4. Proveďte výběr jazyků a pomocí tlačítek Přidat a Odstranit zařaďte do seznamu v nástrojové liště pouze jazyky, které potřebujete mít v nabídce. Nově zařazené jazyky budou umístěny na konec seznamu. 5. Potřebujete-li změnit pořadí jazyků v seznamu, vybírejte postupně jednotlivé jazyky a pomocí tlačítek s šipkou nahoru nebo dolů je zařaďte na požadovanou pozici. Jazyková analýza s využitím slovníků Jazykový analýzátor zahrnuje používání slovníků během rozpoznávání. Nástroj OCR Omnifont (je-li aktivní) používá slovník hlavního rozpoznávacího jazyka a současně používá běžný uživatelský slovník, je-li vložen, pro přezkoušení a opravy rozpoznaných slov v průběhu rozpoznávání. Tím se zvyšuje přesnost. Rovněž se používá k označení neslovníkových slov v textu rozpoznaném nástrojem Omnifont nebo na základě bodové matice. Viz následující položku Metody rozpoznávání Omnifont pro použití jazykového analyzátoru. Metody rozpoznávání Omnifont Nástroj rozpoznávání Omnifont má 6 stupňů pro přesnost/rychlost, často nazývané rozpoznávací, nebo OCR metody. Tyto stupně definují, kolik rozpoznávacích chodů bude uplatněno na každou stránku, a zda bude nebo nebude používán jazykový analyzátor. * Šest metod rozpoznávání: Metody rozpoznávání mohou být nastaveny na liště Možností v roletovém menu, nebo na štítku Přesnosti v dialogovém okénku. * Stupeň 1: Jednostupňové čtení bez jazykové analýzy. Je nejrychlejší. Využití: - Pro dokumenty dobré kvality s typickým jazykem. - Pro stránky obsahující málo textu. * Stupeň 2: Jednostupňové čteni s jazykovým analyzátorem (LA). Využití: - Pro dokumenty dobré kvality s typickým jazykem. - Pro stránky obsahující máló textu. - Když je důležitější rychlost než přesnost * Stupeň 3: Dvoustupňové čtení bez jazykové analýzy, zvané vyrovnané. Použijte pro: - Typické dokumenty přijatelné kvality. - Čtecí jazyk, u kterého není k dispozici jazykový analyzátor. - Dokumenty s mnoha vlastními jmény, nebo neslovníkovými slovy. - Stránky se dvěma a více jazyky. * Stupeň 4: Dvoustupňové čtení s jazykovým analýzátorem (JA). Používejte pro: - Typické dokumenty přijatelné kvality. - Dokumenty bez příliš mnoha vlastních slov a slov, která nejsou ve slovníku. * Stupeň 5: Třístupňové čtení s použitím jazykového analyzátoru. Velmi přesné při použití jednoho nástroje rozpoznávání. Použijte pro: - Značně poškozené dokumenty. - Jazyky se zabudovanými jazykovými analyzátory, ale bez podpory druhého nástroje rozpoznávání: katalánština, čeština, řečtina, maďarština, polština a ruština. * Stupeň 6: Velmi přesné třístupňové čtení s použitím jazykového analyzátoru a dvou nástrojů rozpoznávání. Vhodné použití: - Vysoké požadavky na přesnost, pomalejší zpracování nevadí. - Na výkonných a rychlých počítačích. - Jazyky podporované dvěma nástroji rozpoznávání: dánština, holandština, angličtina, finština, francouzština, němčina, italština, norština, portugalština, španělština, švédština. Hledání příčin snížené přesnosti Mnoho aspektů může neočekávaně způsobit zhoršení výsledků, nebo nesprávné rozpoznávání.Tato sekce shrnuje typické problémy a jejich příčiny. Většinu případů vyřešíte novým nastavením a rozpoznáváním. Špatné rozpoznávání: * Špatná kvalita obrazu vlivem špatného nastavení jasu, nebo rozlišení. Mnoho zeleného zvýraznění, zatímco většina slov je správných: * Nastaven špatný jazyk při povolení jazykové analýzy. * Špatný, nebo chybějící uživatelský slovník. Mnoho špatných znaků, které předtím byly správně rozpoznány: * Špatný, nebo chybějící učební soubor. * Dříve individuálně povolené znaky nejsou již nastaveny. Chybí diakritika, nebo jsou špatně rozpoznány přízvučné znaky: * Nastaven špatný jazyk. Mnoho nesmyslných slov a nekorektních znaků: * Nastaven špatný rozpoznávací nástroj (např.zvolen nástroj pro rozpoznávání bodových matic namísto Omnifontu, nebo naopak), nebo automatická detekce rozpoznávání nepracovala správně. * Orientace obrazu je nesprávná. Buď jste vložili dokument do skeneru nesprávně, nebo autodetekce otočení je špatná. Otočte a opakujte rozpoznání obrazu. V určitých řádkách jsou nesmyslné znaky: * Nesprávně umístěná zóna rozděluje řádek na dva. * Nesprávně umístěná mřížka v tabulkové zóně. * Nesprávné nastavení okrajů v Nástroje/Možnosti/Plocha. Text Obsahuje hlavně číslice a symboly odmítnutí: * Nastaveno rozpoznávání Omnifont, Braille, nebo bodová matice pro zóny obsahující normální text, ale s nastavenými vlastnostmi Pouze čísla, nebo rozpoznávací nástroj pro ručně psaná čísla byl použit pro normální tištěný text. Věříme, že Recognita Plus Vám pomůže a poslouží pro vysoce kvalitní rozpoznávání. Nezapomínejte na různé zdroje, na které se můžete obrátit pro pomoc: * Tato uživatelská příručka * Online Nápověda * Internet: www.caere.com/recognita * Fax: (36 1) 452-3710 * Tel.: (36 1) 452-3706 Doporučujeme vám, abyste si zapsali vaše registrační číslo do níže označeného místa, jakmile jej obdržíte. Budete je mít vždy při ruce, pokud budete potřebovat uživatelskou podporu programu. © Recognita Corp., 1999 Tento softwarový produkt je chráněn autorským právem a veškerá práva jsou vyhrazena Recognita Corp. Recognita a Recognita Plus jsou zapsané ochranné známky Recognita Corp. Všechny ochranné známky jsou uznané. Uznané systémy korekce pravopisu Mezinárodní systém korektury pravopisu katalánštiny, International CorrectSpell(tm) Catalan spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Upraven podle seznamu Catalan word list © 1992 Universitat de Barcelona. Je zakázáno kopírovat a dekompilovat zavedené algoritmy nebo databáze. Mezinárodní systém korektury pravopisu češtiny, International CorrectSpell(tm) Czech spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Upraven podle seznamu slov dodaném Janem Hájkem. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu dánštiny, International CorrectSpell(tm) Danish spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Části převzaté z pravopisného slovníku The Orthographical Dictionary, páté vydání 1988, radou pro dánský jazyk. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu holandštiny, International CorrectSpell(tm) Dutch spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu angličtiny, International CorrectSpell(tm) English spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu finštiny, International CorrectSpell(tm) Finnish spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Upraven podle seznamu slov, který poskytl jazykový ústav University of Helsinki Institute for Finnish Language a Dr. Kolbjorn Heggstad. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu francouzštiny, International CorrectSpell(tm) French spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Upraven podle seznamu slov, který poskytla knihovna Librairie Larousse. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu němčiny, International CorrectSpell(tm) German spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Upraven podle seznamu slov, který poskytl Langenscheidt K.G. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. © držitel licence a ostatní. 1995. Mezinárodní systém korektury pravopisu řečtiny, International CorrectSpell(tm) Greek spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu maďarštiny, International CorrectSpell(tm) Hungarian spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Části technologie a seznam slov poskytla firma Morphologic. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu italštiny, International CorrectSpell(tm) Italian spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Upraven podle seznamu slov poskytnutém Zanichelli S.p.A. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu norštiny, International CorrectSpell(tm) Norwegian spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu polštiny, International CorrectSpell(tm) Polish spelling correction © 1995, podle INSO Corporation. Všechna práva vyhrazena. Části technologie a seznam slov poskytla firma Morphologic. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu portugalštiny, International CorrectSpell(tm) Portuguese spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Části převzaty ze slovníku Dicionario Academico da Lingua Portuguesa. © 1992 vytvořil Porto Editora. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu International CorrectSpell(tm) Russian spelling correction system © 1995 podle INSO Corporation. Všechna práva vyhrazena. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu španělštiny, International CorrectSpell(tm) Spanish spelling correction system © 1995, podle INSO Corporation. Všechna práva vyhrazena. Upraven podle seznamu slov, který poskytla knihovna Librairie Larousse. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Mezinárodní systém korektury pravopisu švédštiny, International CorrectSpell(tm) Swedish spelling correction system © 1995, INSO Corporation. Všechna práva vyhrazena. Je zakázáno kopírovat a dekompilovat zavedené algoritmy a databáze. Informace obsažené v této příručce mohou být měněny bez předchozího oznámení. Obsah ÚVOD KAPITOLA 1 INSTALACE A NASTAVENÍ 5 Požadavky na systém 6 Instalace 7 Nastavení skeneru pro Recognita Plus 9 Změna nastavení skeneru 10 Nastavení skenerů vyhovujících TWAIN 12 Speciální nastavení skeneru pod Windows 95 a Windows 98 15 Registrace 16 KAPITOLA 2 ÚVODNÍ INFORMACE RECOGNITA PLUS 19 Co je vlastně OCR? 20 Stupně zpracování v programu Recognita Plus 20 Postup zpracování v Recognitě Plus 21 Dokument Recognita 22 Obrazovka aplikace a dokumentu 23 Online Nápověda 24 Co je nového v porovnání s verzí 4.0 25 Podpora produktu 28 KAPITOLA 3 ZPRACOVÁNÍ DOKUMENTŮ 31 Přehled zpracování 32 Tvorba dokumentů 33 Přerušení operace a pokračování ve zpracování 36 Rozpoznávání obrazů v dokumentu 37 Práce s dokumenty 38 Uložení dokumentů, textu a obrazů 40 Uložení a posílaní dokumentů 40 Uložení a posílání textu 41 Použití rozšířeného nastavení pro textový výstup 43 Uložení a odeslání obrazů stránek 44 Přetažení myší a použití Clipboardu (technika Drag-and-drop) 46 Spuštění rozpoznávání z jiných aplikací 47 Přímé propojení do aplikací 47 Nástroje rozpoznávání v programech elektronické pošty 48 Podpora kontextového menu v programu Explorer 49 Přetažení myší z okna programu Explorer 50 Zpracování a uložení bez náhledu 50 KAPITOLA 4 PRÁCE S DOKUMENTY 53 Práce se zónami 54 Automatické nebo manuální zónování 55 Základy manuálního zónování 55 Základní vlastnosti zón 56 Základy zónových šablon 59 Práce s tabulkovými zónami 61 Opravy textu 64 Editace 65 Editace tabulek 66 Přezkoušeče 67 Přezkoušení 68 Uživatelské slovníky 70 Učení 72 Pohyb v dokumentech Recognita 75 Změna stránek 75 Použití Prohlížeče 76 Nalezení stránek a textu 78 Užití znakové mapy 80 KAPITOLA 5 ZVÝŠENÍ PŘESNOSTI ROZPOZNÁVÁNÍ 81 Nastavení skeneru 82 Nastavení správného jasu 82 Nastavení správného rozlišení 82 Výběr vhodného způsobu skenování 83 Jazyky a jazyková analýza 83 Jazyky pro rozpoznávání 84 Úprava seznamu jazyků 85 Jazyková analýza s využitím slovníků 86 Metody rozpoznávání Omnifont 86 Hledání příčin snížené přesnosti 88